深圳幻海软件技术有限公司 欢迎您!

  • 腾讯企业容器云平台技术解析

    GaiaStack是腾讯基于Kubernetes打造的容器私有云平台。它服务于腾讯内部各个BG业务,如广告、支付、游戏等。同时也为腾讯云的各行业客户私有云部署提供支持。本文将从自动化运维体系、多集群租户、网络模式等13个方面展开,具体阐述GaiaStack的技术点。GaiaStack的目标是支持各种

  • GPU 容器虚拟化新能力发布和全场景实践

    今天给大家分享的主题是百度智能云在「GPU容器虚拟化」方面的最新进展和全场景实践,希望通过这次分享和大家一起探讨如何在实际业务场景更好的应用GPU容器虚拟化技术。本次分享将首先介绍百度智能云GPU容器虚拟化2.0的升级变化,然后介绍新版本中的技术实现方法并演示具体功能,最后介绍在各类业务场景的实践和

  • 基于 Ray 的大规模离线推理

    大模型离线推理  特点介绍大数据离线推理大模型离线推理(Batch推理)是指在具有数十亿至数千亿参数的大规模模型上进行分布式计算推理的过程,具有如下特点:一次对一批数据进行推理,数据量通常是海量的,所以计算过程通常是离线计算;推理作业执行过程一般同时包含数据处理及模型推理;作业规

  • 移动端渲染原理浅析

    作者| 尚怀军计算机或手机的渲染是一个非常复杂的过程,本文介绍了渲染相关的一些基础知识,并结合iOS和安卓的技术框架介绍了移动端渲染原理,最后详细的解析了iOS中的离屏渲染以及圆角优化的一些方法。渲染基础知识屏幕绘制的原始数据源位图我们在屏幕上绘制图像需要的原始数据叫做位图。位图(Bitm

  • iOS的省电模式原来是游戏模式?深度分析给你答案

    可能很多果粉都没有注意这个细节,从A14开始,“省电模式”这个词就变味了。过去我们只会在电池告急时开启省电模式,暂时降低手机性能、功耗,来延长手机电池的续航。如今,iOS的省电模式,却变成了游戏模式。在省电模式下玩一些大型手游,游戏帧率的稳定性反而比正常状态下更好——这就是iPhone不为人知的隐藏

  • PyTorch环境搭建

    文章目录PyTorch环境搭建一、pytorch简介1.1pytorch是什么?1.2pytorch的优点二、安装pytorch(基于pycharm和anaconda)2.1创建虚拟环境(非必须)2.2安装pytorchPyTorch环境搭建一、pytorch简介1.1pytorch是什么?​Pyt

  • 新手小白如何租用GPU云服务器跑深度学习

    最近刚学深度学习,自己电脑的cpu版本的pytorch最多跑个LexNet,AlexNet直接就跑不动了,但是作业不能不写,实验不能不做。无奈之下,上网发现还可以租服务器这种操作,我租的服务器每小时0.78人民币,简直是发现新大陆,又省下一大笔钱,太开心了吧(啪,什么乱七八糟的)。因为本人小白,所以

  • 一个时代有一个时代的计算架构

    这是阿兰·图灵在1950年论文《计算机器和智能》中的经典提问,围绕着图灵的目标,软件和硬件开启了分头行动。软件,以算法为核心,衍生出了神经网络,并在深度学习的加持下,让人工智能浪潮实现全面汹涌。硬件,以芯片为载体,从CPU、GPU到各类AI芯片,从执行人的计算程序,到像人一样计算。芯片和AI,硬件和

  • 阿里开源自研工业级稀疏模型高性能训练框架 PAI-HybridBackend

    作者| 石浪、满神近年来,随着稀疏模型对算力日益增长的需求,CPU集群必须不断扩大集群规模来满足训练的时效需求,这同时也带来了不断上升的资源成本以及实验的调试成本。为了解决这一问题,阿里云机器学习PAI平台开源了稀疏模型高性能同步训练框架HybridBackend,使得在同成本下GPU集群

  • CUDA编程模型都改了!英伟达架构师团队撰文详解:Hopper为啥这么牛?

    ​在英伟达GTC2022大会上,老黄更新了服役近两年的安培微架构(Ampere),推出Hopper架构,并抛出一块专为超算设计、包含800亿个晶体管的显卡HopperH100,比老前辈A100显卡的540亿晶体管还要高出不少。但光看名字和参数还不够,Hopper到底牛在哪?最近英伟达的架构开发师们发

  • 如何突破Decoder性能瓶颈?揭秘FasterTransformer的原理与应用

    本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。 4月9日,英伟达x量子位分享了一期nlp线上课程,来自NVIDIA的GPU计算专家、FasterTransformer2.0开发者之一的薛博阳老师,与数百位开发者共同探讨了:FasterTransformer2.

  • 当 Mars 遇上 RAPIDS:用 GPU 加速数据科学

    在数据科学世界,Python是一个不可忽视的存在,且有愈演愈烈之势。而其中主要的使用工具,包括Numpy、Pandas和Scikit-learn等。Mars在MaxCompute团队内部诞生,本文将分享如何通过Mars让Numpy、pandas和scikit-learn等数据科学的库能够并行和分布式

  • PyTorch&TensorFlow跑分对决:哪个平台运行NLP模型推理更快

    关于PyTorch和TensorFlow谁更好的争论,从来就没有停止过。开源社区的支持度、上手的难易度都是重要的参考。还有人说:学术界用PyTorch,工业界用TensorFlow。 然而还有一项不可忽略的因素,就是二者的实际性能。没关系,不服跑个分?!最近,一位来自“Huggingfac

推荐阅读