长垣| 绥化| 景县| 正蓝旗| 日喀则| 通化县| 色达| 徽县| 威信| 新丰| 宜秀| 新建| 通州| 喜德| 威海| 石台| 太仓| 沁水| 太康| 嘉峪关| 齐河| 穆棱| 九江县| 独山子| 类乌齐| 伊通| 利川| 天长| 子长| 藤县| 许昌| 大方| 泾源| 门源| 霍邱| 焦作| 户县| 曲沃| 连州| 乐至| 和顺| 介休| 肇东| 洛浦| 福州| 岚县| 寻甸| 嘉禾| 禹城| 范县| 芒康| 信丰| 岱山| 塔河| 岳西| 大荔| 呼和浩特| 武汉| 桐城| 调兵山| 沙雅| 牡丹江| 平泉| 连江| 达日| 札达| 台湾| 灵武| 白碱滩| 化德| 安庆| 嵊州| 安宁| 宁津| 巴马| 静乐| 四平| 稻城| 恭城| 湟源| 庐山| 荔波| 禄丰| 喀什| 额济纳旗| 南和| 梅河口| 南海镇| 马尔康| 沭阳| 离石| 阜新市| 抚顺县| 秀山| 戚墅堰| 孟村| 岱岳| 乃东| 武汉| 定南| 金山屯| 紫云| 海城| 苏州| 酉阳| 大同区| 灵山| 辽阳县| 苏尼特左旗| 奉新| 高雄县| 金华| 东丰| 巴林左旗| 榆树| 绥江| 富蕴| 兴文| 杭锦旗| 应县| 库车| 隰县| 凤山| 双柏| 长岛| 德保| 江孜| 旅顺口| 当阳| 葫芦岛| 浦江| 莫力达瓦| 文县| 铜仁| 铜川| 漳浦| 赵县| 台中市| 覃塘| 庐江| 大方| 通化市| 吴起| 分宜| 四方台| 潢川| 万年| 宾县| 库伦旗| 息烽| 高阳| 珲春| 宁远| 塔河| 沭阳| 桃园| 三穗| 平凉| 随州| 彭州| 靖州| 册亨| 兴业| 嵊泗| 济宁| 达坂城| 札达| 惠阳| 绥滨| 涿鹿| 石景山| 衡阳市| 新干| 长寿| 河津| 金门| 上高| 覃塘| 图们| 威宁| 萨嘎| 上饶市| 南漳| 宽甸| 津南| 德昌| 镇宁| 汤原| 海安| 高唐| 松溪| 两当| 蔚县| 吉水| 南城| 新竹县| 扶绥| 内蒙古| 香河| 昭平| 凤凰| 从江| 宝坻| 宜川| 普洱| 石林| 麟游| 敦化| 蚌埠| 同安| 钦州| 富宁| 泰来| 东平| 上杭| 朝天| 启东| 资溪| 平陆| 阳谷| 峨眉山| 宁武| 汝南| 泗洪| 武昌| 神农顶| 通辽| 方山| 弓长岭| 崇州| 猇亭| 疏附| 寿宁| 合作| 正宁| 饶平| 丹阳| 石狮| 海丰| 新竹市| 晋州| 普陀| 枣阳| 黄冈| 科尔沁右翼中旗| 惠水| 连州| 武清| 扬州| 大荔| 赣榆| 北川| 珠穆朗玛峰| 祁连| 岚皋| 朝阳县| 茶陵| 甘南| 平安| 射阳| 景洪| 渝北| 庄河|

优酷上亿条账户信息在暗网被卖2000元全部打包带走

2019-09-19 08:24 来源:江苏快讯

  优酷上亿条账户信息在暗网被卖2000元全部打包带走

    截至8日下午5点,强降雨导致遂川、泰和、井冈山、万安等县(市)万人、万亩农田受灾,房屋倒塌440间,紧急转移受灾群众万人,直接经济损失亿元。”海滨高速副大队长唐磊介绍。

随着本次论坛的成功举办,2018年上海市公共机构节能宣传周也正式拉开序幕。  北京市在今年的5月正式实行的《北京市机动车停车条例》中明确提出:非电动汽车不得占用电动汽车专用泊位,违反规定的由公安机关交通管理部门责令改正,依法给予处罚。

    央广网北京6月9日消息(记者丁飞刘飞)据中国之声《新闻纵横》报道,2016年1月7日《我在故宫修文物》的纪录片在央视纪录频道播出,片中第一次完整呈现了世界级的中国文物修复过程和技术,一时间文物修复成为了人们茶余饭后的热议话题。“协和万邦”的思想也被历代政治家和思想家所继承和弘扬。

    新华社东京6月10日电(记者王可佳邓敏)数万名日本民众10日下午冒雨来到国会前举行集会,呼吁彻查安倍政府所牵涉的森友、加计学园等一系列丑闻,要求安倍内阁集体下台。然而,也有人对网络分享母乳的卫生问题和有关适配性的健康隐患提出了质疑。

记者走到小朋友们摔倒的地方发现地面被完全冲洗干净,也闻不到任何异味。

  焰火以四季为主题,《春》描绘生机蓬勃的景象;《夏》突出夏花绚烂的色彩;《秋》传达丰收的喜悦;《冬》为夏日海滨增添别样的清凉。

  所有的母乳捐赠者都是自愿捐赠,不涉及任何金钱交易。  视频中展示了许多往届世界杯极具纪念意义的场景以及在俄罗斯的来自各参赛国的球迷。

    故宫文物医院就是这样一处集合了古色古香的文物与高端先进的现代技术的地方。

  编辑:任芳这意味着,很多人已经选择用外卖替代“在家做饭”了。

    据中国铁路呼和浩特局集团有限公司相关负责人介绍,“草原号”旅游列车采取固定编组、固定交路,全列配置软卧、硬卧车厢和多功能餐车,卧具备品比照星级标准,全列开通移动WIFI,提供了集吃、住、行、游一体化的移动观光平台和专列直达、大巴接力的一站式服务,并推出“家庭游”、“情侣游”、“同学游”等定制服务。

  据悉,钦州市党委政府连夜开会部署,并迅速拆除了非法再生铝生产窝点。

  随后,通过法定程序审批,晚上9点,执行干警将这位“老赖”送进了拘留所。这个只能专心“看”电影的城市影院,也得到了岛上居民的喜爱。

  

  优酷上亿条账户信息在暗网被卖2000元全部打包带走

 
责编:
您正在使用IE低版浏览器,为了您的雷锋网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
雷锋网 读懂智能&未来
人工智能 正文
发私信给程弢
发送

0

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

本文作者:程弢 2019-09-19 14:03
导语:从这次发布的测试结果来看,TPU似乎已经超出了业界的预期,但是藏在这一芯片背后的内部架构究竟有什么秘密呢,我们从Jouppi此前发布的论文当中,可以找到答案。
“大师班”的第一节课就是由儿基会儿童早期发展部主任布里托向“芝麻街”中的卡通人物格罗弗解释保护、刺激和良好营养对健康的大脑发育的重要性。

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

在谷歌发布TPU一年后,这款机器学习定制芯片的神秘面纱终于被揭开了。

昨日,谷歌资深硬件工程师Norman Jouppi刊文表示,谷歌的专用机器学习芯片TPU处理速度要比GPU和CPU快15-30倍(和TPU对比的是英特尔Haswell CPU以及Nvidia Tesla K80 GPU),而在能效上,TPU更是提升了30到80倍。

从这次发布的测试结果来看,TPU似乎已经超出了业界的预期,但是藏在这一芯片背后的内部架构究竟有什么秘密呢,我们从Jouppi此前发布的论文当中,可以找到答案。

据雷锋网(公众号:雷锋网)了解,早在四年前,谷歌内部就开始使用消耗大量计算资源的深度学习模型,这对CPU、GPU组合而言是一个巨大的挑战,谷歌深知如果基于现有硬件,他们将不得不将数据中心数量翻一番来支持这些复杂的计算任务。

所以谷歌开始研发一种新的架构,Jouppi称之为“下一个平台”。Jouppi曾是MIPS处理器的首席架构师之一,他开创了内存系统中的新技术。三年前他加入谷歌的时候,公司上下正在用CPU、GPU混合架构上来进行深度学习的训练。

Jouppi表示,谷歌的硬件工程团队在转向定制ASIC之前,早期还曾用FPGA来解决廉价、高效和高性能推理的问题。但他指出,FPGA的性能和每瓦性能相比ASIC都有很大的差距。他解释说,“TPU可以像CPU或GPU一样可编程,它可以在不同的网络(卷积神经网络,LSTM模型和大规模完全连接的模型)上执行CISC指令,而不是为某个专用的神经网络模型设计的。一言以蔽之,TPU兼具了CPU和ASIC的有点,它不仅是可编程的,而且比CPU、GPU和FPGA拥有更高的效率和更低的能耗。

TPU的内部架构

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

该图显示了TPU上的内部结构,除了外挂的DDR3内存,左侧是主机界面。指令从主机发送到队列中(没有循环)。这些激活控制逻辑可以根据指令多次运行相同的指令。

TPU并非一款复杂的硬件,它看起来像是雷达应用的信号处理引擎,而不是标准的X86衍生架构。Jouppi说,尽管它有众多的矩阵乘法单元,但是它GPU更精于浮点单元的协处理。另外,需要注意的是,TPU没有任何存储的程序,它可以直接从主机发送指令。

TPU上的DRAM作为一个单元并行运行,因为需要获取更多的权重以馈送到矩阵乘法单元(算下来,吞吐量达到了64,000)。Jouppi并没有提到是他们是如何缩放(systolic)数据流的,但他表示,使用主机软件加速器都将成为瓶颈。

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

256×256阵列缩放数据流引擎,经过矩阵乘法积累后实现非线性输出

从第二张图片可以看出,TPU有两个内存单元,以及一个用于模型中参数的外部DDR3 DRAM。参数进来后,可从顶部加载到矩阵乘法单元中。同时,可以从左边加载激活(或从“神经元”输出)。那些以收缩的方式进入矩阵单元以产生矩阵乘法,它可以在每个周期中进行64,000次累加。

毋庸置疑,谷歌可能使用了一些新的技巧和技术来加快TPU的性能和效率。例如,使用高带宽内存或混合3D内存。然而,谷歌的问题在于保持分布式硬件的一致性。

TPU对比Haswell处理器

在和英特尔“Haswell”Xeon E5 v3处理器来的对比中,我们可以看到,TPU各方面的表现都要强于前者。

在Google的测试中,使用64位浮点数学运算器的18核心运行在2.3 GHz的Haswell Xeon E5-2699 v3处理器能够处理每秒1.3 TOPS的运算,并提供51GB/秒的内存带宽;Haswell芯片功耗为145瓦,其系统(拥有256 GB内存)满载时消耗455瓦特。

相比之下,TPU使用8位整数数学运算器,拥有256GB的主机内存以及32GB的内存,能够实现34GB/秒的内存带宽,处理速度高达92 TOPS ,这比Haswell提升了71倍,此外,TPU服务器的热功率只有384瓦。

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

除此之外,谷歌还测试了CPU、GPU和TPU处理不同批量大小的每秒推断的吞吐量。

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

如上图所示,在小批量任务中(16),Haswell CPU的响应时间接近7毫秒,其每秒提供5482次推断(IPS),其可以实现的最大批量任务(64)每秒则可以完成13194次推断,但其响应时间为21.3毫秒。相比之下,TPU可以做到批量大小为200,而响应时间低于7毫秒,并提供225000个IPS运行推理基准,是其峰值性能的80%,当批量大小为250,响应时间为10毫秒。

不过需要注意的是,谷歌所测试的Haswell Xeon处理器似乎也不能完全说明问题,英特尔Broadwell Xeon E5 v4处理器和最新的“Skylake”Xeon E5,每核心时钟(IPC)的指令比这款处理器提升了约5%。在Skylake是28核,而Haswell为18核,所以Xeon的总体吞吐量可能会上升80%。当然,这样的提升与TPU相比仍有差距。

最后雷锋网需要强调的是,TPU是一个推理芯片,它并非是要取代GPU,可以确定的是,TPU与CPU一起使用对训练分析更加有益。但对于CPU制造商而言,如何研发出像ASIC一样兼顾性能和能效的芯片是现在以及未来要做的。

可以确定的是,谷歌已经逐渐在自己的数据中心部署TPU,但是上述测试数据只是理论结果,实际应用表现如何?我们还不得而知。

Via nextplatform,雷锋网编译

雷锋网版权文章,未经授权禁止转载。详情见转载须知

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?
分享:
相关文章

文章点评:

表情

略懂技术的小编

关注一切有未来感的产品及技术!
当月热门文章
最新文章
为了您的账户安全,请验证邮箱
您的邮箱还未验证,完成可获20积分哟!
请验证您的邮箱
立即验证
完善账号信息
您的账号已经绑定,现在您可以设置密码以方便用邮箱登录
立即设置 以后再说
请填写申请人资料
姓名
电话
邮箱
微信号
作品链接
个人简介
仙地 黄湖镇 色地乡 阳朔东街 陈潭秋
加纳 普迹 文晖街道 中路乡 龙渠村