深圳幻海软件技术有限公司 欢迎您!

  • 【数据分析 - 基础入门之pandas篇②】- pandas数据结构——Series

    文章目录前言一、Series的创建1.1列表创建1.2NumPy数组创建1.3字典创建二、Series索引2.1显式索引2.2隐式索引三、Series切片2.1显式切片2.2隐式切片四、Series基本属性和方法4.1属性4.2方法4.3案例——使用bool值去除空值五、Series运算六、Seri

  • 边缘计算的兴起:改变技术和连接的未来

    在当今快节奏的数字环境中,高效数据处理和减少延迟的需求已变得至关重要。作为对这种需求的回应,一种称为边缘计算的新计算范式已经出现。边缘计算使计算和数据存储更接近数据生成源,从而实现实时处理并减少对集中式云基础设施的依赖。本文将深入探讨边缘计算的兴起、对各个行业的影响,以及如何改变技术和连接的未来。什

  • 2023年云数据管理预测

    当谈到未来的云数据管理策略时,精确性是需要关注的一个词。Komprise公司首席运营官、总裁兼联合创始人KrishnaSubramanian分析了当今云计算的增长状况,并分享了云数据管理企业需要注意并将其纳入增长战略的预测。云浪费非常猖獗。如果没有对云中的非结构化数据特征和存储架构的详细了解,您还不

  • 初探富文本之CRDT协同算法

    初探富文本之CRDT协同算法CRDT的英文全称是Conflict-freeReplicatedDataType,最初是由协同文本编辑和移动计算而发展的,现在还被用作在线聊天系统、音频分发平台等等。当前CRDT算法在富文本编辑器领域的协同依旧是典型的场景,常用于作为实现文档协同的底层算法,支持多个用户

  • vue3响应式原理以及ref和reactive区别还有vue2/3生命周期的对比,第二天

    前言:前天我们学了ref和reactive,提到了响应式数据和Proxy,那我们今天就来了解一下,vue3的响应式在了解之前,先复习一下之前vue2的响应式原理vue2的响应式:原理:对象类型:通过Object.defineProperty()对象的读取,修改进行拦截,也就是数据劫持,响应式的根基缺

  • 学术科研无从下手?27 条机器学习避坑指南,让你的论文发表少走弯路

    内容一览:如果你刚接触机器学习不久,并且未来希望在该领域开展学术研究,那么这份为你量身打造的「避坑指南」可千万不要错过了。关键词:机器学习科研规范学术研究机器学习学术小白,如何优雅避坑坑、让自己的论文顺利发表?来自苏格兰赫瑞瓦特大学数学与计算机科学学院的MichaelA.Lones副教授,曾在202

  • 使用CycleGAN训练自己制作的数据集,通俗教程,快速上手

    总结了使用CycleGAN训练自己制作的数据集,这里的教程例子主要就是官网给出的斑马变马,马变斑马,两个不同域之间的相互转换。教程中提供了官网给的源码包和我自己调试优化好的源码包,大家根据自己的情况下载使用,推荐学习者下载我提供的源码包,可以少走一些弯路,按照我的教程,能较快上手训练使用。目录一、源

  • 四个维度搞懂 Nacos 注册中心

    大家好呀,我是楼仔。现如今市面上注册中心的轮子很多,我实际使用过的就有三款:Eureka、Gsched、Nacos,由于当前参与Nacos集群的维护和开发工作,期间也参与了Nacos社区的一些开发和BugFix工作,过程中对Nacos原理有了一定的积累,今天给大家分享一下Nacos动态服务发现的原理

  • 聊聊最近基于 S3 的项目

    提起对象存储,业界唯一扛把子就是 AWS Simple Storage Service (S3), 国内云厂商不需要做什么,要什么创新,直接抄就完事。协义都是现成的,哪家厂商敢不支持 s3 协义,都会被现实打脸,纯纯的开

  • 什么场景下,不适合使用Apache Kafka?

    译者|吉锴策划|云昭ApacheKafka是处理流式数据的事实标准。随着它在各行各业中的广泛应用,我经常会听到一个非常有意思的问题:我什么时候不适合使用ApacheKafka?流式数据处理平台有哪些限制?Kafka在什么场合下不能胜任?这篇文章探讨了Kafka擅长做的和不擅长做的场景。并且用单独的章

  • 全链路压测:影子库与影子表之争

    作者| 葛天萌(智云)一、业界盛传的全链路压测是什么​全链路压测诞生于阿里巴巴双11备战过程,如果说双11大促是阿里业务的“期末考试”,全链路压测就是大考前的“模拟考试”,诞生后被誉为双11稳定性保障的“核武器”。全链路压测通过在生产环境对业务大流量场景进行高仿真模拟,获取最真实的线上实际

  • 使用Java和Python进行数据统计和分析

    Java和Python是当今最流行的两种计算机语言。两者都非常成熟,并提供了工具和技术生态系统,帮助我们解决数据科学领域出现的挑战性问题。每种语言都各有优势,我们要知道什么时候应该使用哪种工具,或者什么时候它们应该协同工作相互补充。Python是一种动态类型语言,使用起来非常简单,如果我们不想接触复

  • 阿里云EMR Remote Shuffle Service在小米的实践

    阿里云EMR自2020年推出RemoteShuffleService(RSS)以来,帮助了诸多客户解决Spark作业的性能、稳定性问题,并使得存算分离架构得以实施,与此同时RSS也在跟合作方小米的共建下不断演进。本文将介绍RSS的最新架构,在小米的实践,以及开源。一问题回顾Shuffle是大数据计算

  • MD5 到底是不是加密?

     今天想跟大家谈谈:「MD5到底是加密的吗?」    MD5是程序开发中非常常用的一种算法,很多人都用过。提到MD5,大多数人的反应都是「这是一种加密算法」,懂得多点的人还会说「可以用于给密码加密」,再懂点的还知道「MD5已经有被破解的可能性了」。但

  • 详解ETL工具十大必备的功能特性

    概述Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行。说白了就是,很有必要去理解一般ETL工具必备的特性和功能,这样才更好的掌握Kettle的使用。今天主要先描述ETL工具的通用功能。ETL工具的功能之一:连接任何ETL工具都应该有能力连接到类型

  • 干货收藏!Python完整代码带你一文看懂抽样

    1.什么时候需要抽样抽样工作在数据获取较少或处理大量数据比较困难的时期非常流行,这主要有以下几方面原因:数据计算资源不足。计算机软硬件的限制是导致抽样产生的基本原因之一,尤其是在数据密集的生物、科学工程等领域,不抽样往往无法对海量数据进行计算。数据采集限制。很多时候抽样从数据采集端便已经开始,例如做

  • 互联网架构“高并发”到底怎么玩?

    最近留言问“高并发”的朋友颇多,公众号又不支持历史文章检索,故重新优化发布,希望大家有收获。什么是高并发?高并发(HighConcurrency)是互联网分布式系统架构设计中必须考虑的因素之一,它通常是指,通过设计保证系统能够同时并行处理很多请求。高并发相关的常见指标有哪些?响应时间(Respons

  • 数据清洗&预处理入门完整指南

    数据预处理是建立机器学习模型的***步(也很可能是最重要的一步),对最终结果有决定性的作用:如果你的数据集没有完成数据清洗和预处理,那么你的模型很可能也不会有效——就是这么简单。人们通常认为,数据预处理是一个非常枯燥的部分。但它就是「做好准备」和「完全没有准备」之间的差别,也是表现专业和业余之间的差

  • 我爬取分析美团网,原来北京上海Top10美食是它们

    数据爬取三步曲之前方有坑工作需求需要采集OTA网站的美食数据,某个城市的饭店类型情况等。对于老饕来说这不算个事。。。然而***的结果是中午晚饭都没有时间去吃了。。。情况如下ChromeF12直接定位get请求,response的结果是json,研究下get的参数发现有个奇怪的参数token?!先不管

  • 读完这篇,你一定能真正理解Redis持久化

     它支持的数据类型很丰富,如字符串、链表、集合、以及散列等,并且还支持多种排序功能。什么叫持久化?用一句话可以将持久化概括为:将数据(如内存中的对象)保存到可***保存的存储设备中。持久化的主要应用是将内存中的对象存储在数据库中,或者存储在磁盘文件中、XML数据文件中等等。也可以从如下两个

推荐阅读