深圳幻海软件技术有限公司 欢迎您!

  • 干货」数据分析常用的10种统计学方法,附上重点应用场景

    干货」数据分析常用的10种统计学方法,附上重点应用场景文章知识点与官方知识档案匹配,可进一步学习相关知识Python入门技能树首页概览281661人正在系统学习中

  • 什么时候应该选择边缘计算而不是云?

    物联网的兴起可谓天文数字。到2030年,全球联网物联网设备的数量预计将略高于290亿台。对于需要监控和响应传入数据的企业来说,边缘计算将变得与迄今为止的云迁移一样重要。然而,对于企业而言,关于边缘或云的决策不太可能是二元的。Forrester的边缘计算和物联网研究负责人MichelePelino说:

  • C#通过ML.NET实现机器学习(纽约出租车价格的预测)

    版本要求:VisualStudio201715.6或者以后版本创建控制台应用程序1创建一个.NETCoreConsoleApplication2然后在项目中新建一个Data文件夹,用来放置数据和模型文件3安装Microsoft.MLNuGetPackage,在以相同的方法安装Microsoft.ML

  • 企业如何牢记云主权并确保云安全

    ​事实表明,云主权必须是企业采用更广泛的云计算方法的核心。云计算一直是技术创新的最主要的推动者之一,它彻底改变了服务的设计和交付方式——从社交媒体和流媒体平台的兴起,再到新商业模式和政府数字平台的开发。凭借其加速创新的能力,云计算已成为新业务方式的基本支柱,并实现了现代服务交付。对许多企业来说,云计

  • 边缘计算点燃跨行业的创新革命

    在新冠疫情爆发之后,很多企业迅速将工作负载转移到云端,以推动持续的生产力,并确保业务连续性。但云计算总是最佳选择吗?并不是这样。全球目前采用的物联网设备多达100亿台,它们实时生成大量信息,如果它们必须将数据来回发送到云端,则导致性能下降,传输和计算延迟,降低灵活性,并增加成本。这促使企业IT团队利

  • 聊聊秒杀系统的设计(三)

    前言秒杀请求在高度集中在某一个时间点。这样一来,就会导致一个特别高的流量峰值,它对资源的消耗是瞬时的。能够抢到商品的人数是有限的,也就是说10人和1000人发起请求的结果都是一样的。也就是说真正开始下单时,秒杀请求并不是越多越好。一、秒杀中的削峰由于服务器的处理资源是恒定的,用或者不用它的处理能力都

  • 【语义分割】数据增强方法(原图与标签同时扩增)

    1、数据增强作用  避免过拟合  提升模型的鲁棒性 提高模型的泛化能力 避免样本不均衡的问题2.、数据增强分类可分为两类:在线增强和离线增强。这两者的区别在于离线增强是在训练前对数据集进行处理,往往能得到多倍的数据集,在线增强是在训练时对加

  • ClickHouse的查询性能优势

    01向量化引擎在存储引擎的设计上,ClickHouse采用了基于列存储的存储结构设计。列存储在很多场景中极大地降低了数据分析过程中读取的数据量,图1展示了列存储相比于行存储减少数据量的原理。明显地,在宽表场景下,由于行存储在抽取某些列时必须读取该行的所有列,因此读取了大量无效的数据(图1种行存方案中

  • 如何使用Python遍历HTML表和抓取表格数据

    译者|李睿审校|孙淑娟表格数据是网络上最好的数据来源之一。它们可以存储大量有用的信息,同时又不丢失易于阅读的格式,使其成为数据相关项目的金矿。无论是抓取足球赛事数据还是提取股票市场数据,都可以使用Python从HTML表中快速访问、解析和提取数据,而这需要感谢Requests和BeautifulSo

  • count(*)查询性能很差?用这五招轻松优化

    前言最近我在公司优化过几个慢查询接口的性能,总结了一些心得体会拿出来跟大家一起分享一下,希望对你会有所帮助。我们使用的数据库是Mysql8,使用的存储引擎是Innodb。这次优化除了优化索引之外,更多的是在优化count(*)。通常情况下,分页接口一般会查询两次数据库,第一次是获取具体数据,第二次是

  • Python居然被用来开发游戏了?盘点你想不到的Python开发场景

    都说学Python好,好在哪?Python可以用来做什么?当YouTube、Quora、Pinterest、Facebook、Reddit、Instagram、Google、Netflix和Spotify等流行服务开始使用这种语言时,Python已经成为软件开发者最喜欢的新语言。除了我们熟悉的数据科

  • DDD领域驱动设计如何进行工程化落地

    引言前面几篇文章中,笔者给大家阐述了DDD领域驱动设计的三大过程,重点围绕如何通过战略设计与战术设计进行DDD领域模型分析以及沉淀,但是还没有涉及到工程层面的落地。所有的这些架构理论或者设计模式到最后都是为了让我们的代码结构更加清晰,扩展性以及维护性更强。从而开发出bug少稳定性更好的应用。因此本文

  • B站离线多机房架构实践

    01背景随着B站业务的高速发展,业务数据的生产速度变得越来越快,离线集群规模快速膨胀,既有机房内的机位急剧消耗,在可预见的不久的将来会达到机房容量上限,阻塞业务的发展。因此,如何解决单机房容量瓶颈成为了我们亟待解决的问题。目前,针对机房容量问题的解决方案业界主要有以下两种:1) 集群整体搬

  • Python 数据可视化的三大步骤

    1、首先,要知道我们用哪些库来画图?matplotlibPython中最基本的作图库就是matplotlib,是一个最基础的Python可视化库,一般都是从matplotlib上手Python数据可视化,然后开始做纵向与横向拓展。Seaborn是一个基于matplotlib的高级可视化效果库,针对的

  • 慢SQL治理的经典案例分享

    菜鸟供应链金融慢sql治理已经有一段时间,自己负责的应用持续很长时间没有慢sql告警,现阶段在推进组内其他成员治理应用慢sql。这里把治理过程中的一些实践拿出来分享下。一、全表扫描1.案例复制SELECTcount(*)AStmp_countFROM(SELECT*FROM`XXX_rules`WH

  • 如何保障云上数据安全?一文详解云原生全链路加密

    什么是云原生全链路加密数据安全在云上的要求,可以用信息安全基本三要素"CIA"来概括,即机密性(Confidentiality)、完整性(Integrity)和可用性(Availability)。机密性专指受保护数据只可以被合法的(或预期的)用户可访问,其主要实现手段包括数据的访问控制、数据防泄露、

  • 安排上!数据科学中必须了解的Python基础库

     正在学习数据科学的你希望快刀斩乱麻解决其中的一些问题吗?那我们果断要把目光投向Python。 本文将介绍一些基础的数据科学库,学会之后你也可以6到飞起。核心库Python有三个核心数据科学库,在此基础上还创建了许多其他的库。这三个核心数据科学库分别为:NumpyScipyMat

  • 5天破10亿的哪吒,为啥这么火,Python来分析

     不知道大家最近有没有去看电影,最近身边的朋友都在向我安利一部叫做《哪吒之魔童降世》的动漫电影。大家无一例外,都说非常的好看。看一下最近的微信搜索指数,比火热的电视剧“亲爱的热爱的”搜索指数要高出近6倍,比迪斯尼的“狮子王”要高出22倍,确实非常火。小编抱着好奇的心态,去猫眼上看了一下,结

  • 这篇文章专治MQ中间件各种疑难杂症

    【51CTO.com原创稿件】上周分享的一篇《面试大杀器:为什么一定要用MQ中间件?》受到了大家的一致好评,今天这篇文章为大家总结下MQ应用中的一些疑难杂症。消息队列有什么优点和缺点?为什么使用消息队列?假设你的业务场景遇到个技术挑战,如果不用MQ可能会很麻烦,但是你用了MQ之后会带给你很多好处。消

  • 力压 R,Python 在数据科学领域风生水起

    TIOBE最新发布的9月编程语言排行榜中,Python凭4.67%的增速以0.26%的优势力压C++,逆袭成功进入Top3。而近一年势头不灭的Python在数据分析领域,是专家们的必备技能。随着IT行业的增长,对有经验的数据科学家的需求也水涨船高,而Python也一跃而成最受欢迎的语言。本文旨在介绍

推荐阅读