r52，IBM笔记本电脑R52,这台电脑好不好用

1，IBM笔记本电脑R52,这台电脑好不好用

太老了，性能不如现在的上网本。

r52

2，IBM笔记本R51E系列与R52系列的区别

R51e系列主板芯片组都是ATi的,而R52的主板芯片组都是Intel的,故R51e没有迅驰机型而R52有,还有,R51e只有指点杆而没有触摸式鼠标,R51e也没有红外接口.当然"同等"配置的区别还在于价格咯.ThinkPad所有后缀e的机型都是相应的不带e的机型的简化版本，一般使省去了象指纹识别、嵌如式安全芯片、蓝牙、APS硬盘保护技术等一些[普通用户用不到的东西，当然价格相比之下就便宜了（品质还是一样的好）

r52

3，IBM ThinkPad R52

笔记本的扬声器一般都不会很大的，满足你一般的声音需求就行了，你要是对影音有特殊需要建议加个外接的扬声器，这样会好一些

是的可能出毛病了，喇叭出毛病了，一般小情况

要是一直都是很小，那么就是本身的喇叭的功率就小，要是开始还是很大的，那就重新做个系统并重装下驱动 http://think.lenovo.com.cn/support/driver/driversdownlist.aspx?categoryid=8046

r52

4，R52是什么电阻

r52应该是该电路电阻的序号，是电路板的丝印，不是该电阻的阻值，可以追问我

这个电阻串联在三极管基极，是限流的，或者叫降压的。这种pnp三极管，在电阻左端的buzz端加低电平，三极管导通。假如没有这个电阻，则从发射极即+5v端到基极要加5v的电压，从发射极到基极称为发射结，就是一个二极管，只允许加0.7v的电压，现在加了5v电压，那发射结肯定会烧坏了，那三极管就烧坏了。而烧坏了，就是因为能过发射结的电流过大了，串联一个电阻就起了限流的作用，保护了三极管。或者看成，通过电阻的降压，发射结才保证只加0.7v的电压，不被烧坏。

5，R52怎么一键恢复重装系统

R52重装系统： 1、用【u深度u盘启动盘制作工具】制作u启动盘，重启电脑等待出现开机画面按下启动快捷键，选择u盘启动进入到u深度主菜单，选取“【02】Win8PE装机维护版（新机器）”选项 2、进入win8PE系统，将会自行弹出安装工具，点击“浏览”进行选择存到u盘中win系统镜像文件。 3、等待u深度pe装机工具自动加载win系统镜像包安装文件，只需选择安装磁盘位置，然后点击“确定”按钮即可。 4、此时在弹出的提示窗口直接点击“确定”按钮。 5、随后安装工具开始工作，请耐心等待几分钟。 6、完成后会弹出重启电脑提示，点击“是（Y）”按钮即可。 7 、此时就可以拔除u盘了，重启系统开始进行安装，我们无需进行操作，等待安装完成即可，最终进入系统桌面前还会重启一次

装一个

6，Thinkpad R52 性能特点?

IBM ThinkPad R52 1846AC2 主要性能设计类型光驱内置 CPU类型奔腾-M(Dothan-533) 迅驰技术支持标称频率 2GHz CPU描述 Pentium-M 760 二级缓存 2048KB 主板描述 I915PM 屏幕尺寸 14.1英寸屏幕描述 TFT LCD 是否宽屏否内存类型 DDRII 内存大小 512MB 内存描述最大支持内存2048(MB) IBM ThinkPad R52 1846AC2 存储性能硬盘大小 80GB 光驱类型康宝光驱描述 8/24×24×24 软驱描述无 IBM ThinkPad R52 1846AC2 视频/音频显卡类型独立显卡显卡芯片 ATI Radeon X300 显存类型 PCI Express x16 显存容量 64 音频系统 SoundMAX IBM ThinkPad R52 1846AC2 输入输出鼠标描述 IBM ThinkPad UltraNav WLAN性能 802.11b/g(54Mbps) 网卡描述 1000Mbps以太网卡调制解调器 56K 标准接口 2个USB 2.0、RJ-45、RJ-11、IEEE 1394、S-Video out、1 (EPP)、1 VGA、1 TypeII IBM ThinkPad R52 1846AC2 电能规格电源管理 72W AC/DC电源适配器电池类型 6芯锂电池供电时间 3.6小时 IBM ThinkPad R52 1846AC2 环境要求工作温度 10-31℃ 工作湿度 8%-80% 存储温度 -25-60℃ 存储湿度 5%-95% IBM ThinkPad R52 1846AC2 基本特征外壳材质复合材质外形尺寸 314×260×34mm 笔记本重量 2800g IBM ThinkPad R52 1846AC2 其他特性操作系统 Windows XP Home 上市日期 2006 附带软件 Norton AntiVirus 2005 with 90 days of virus definition upgrades, PC Doctor diagnostics, ThinkPad Configuration Utility, ThinkVantage Rescue and Recovery 随机附件电源适配器、软件光盘、说明书其他特点支持双屏显示

7，IBM R52 的配置是什么

产品类型商用　　上市时间 2005 　　处理器型号奔腾-M(Dothan-533) 　　标称主频 1.86GHz 　　前端总线 533MHz 　　迅驰描述支持　　标配内存容量 256MB 　　内存类型 DDRII 　　最大支持内存 PC2-4200 DDR2 SDRAM 　　硬盘/光驱　　硬盘容量 60GB 　　硬盘描述 ATA-100 (Enhanced IDE) 　　光驱类型 DVD-ROM 　　光驱描述 8X 　　显卡/音效　　显卡类型独立显卡　　显卡芯片 ATI Radeon X300 　　显存/位宽 64 　　显示屏　　屏幕尺寸 14.1英寸　　是否宽屏否　　屏幕描述 1024x768 　　尺寸/重量　　笔记本重量 2800g 　　外形尺寸 34*314*260 　　网络通信　　无线网卡无线网卡Intel PRO/Wireless 2200BG 　　网卡描述 1000Mbps以太网卡　　调制解调器 56K V.92 designed modem 　　鼠标/键盘　　键盘描述 Full size 　　接口　　其他接口 AC adapter 　　Expansion Bus port (for Dock II/Mini Dock or Port Replicator II) 　　External Display 　　RJ11 　　RJ45 　　1个并口　　IEEE1394 　　Microphone / Line in 　　Infrared 　　Headphone / Line out 　　S-Video out 　　2 USB2.0 　　电源描述　　电池类型 6 Cell Lithium-Ion 　　续航时间 3.6 Hrs 　　其他　　操作系统中文Microsoft Windows XP家庭版　　质保时效 1年部件及人力（系统电池：1年）　　附带软件 Access Program, ThinkVantage Access Connections, ThinkVantage Rescue and Recovery 　　Adobe Acrobat Reader 　　其他性能安全特性: Hard disk drive password 　　Security Slot 　　Supervisor password 　　加电口令

8，ibm R52的笔记本配置详细是什么

主要性能产品类型商用上市时间 2005 处理器型号奔腾-M(Dothan-533) 标称主频 1.86GHz 前端总线 533MHz 迅驰描述支持标配内存容量 256MB 内存类型 DDRII 最大支持内存 PC2-4200 DDR2 SDRAM 硬盘/光驱硬盘容量 60GB 硬盘描述 ATA-100 (Enhanced IDE) 光驱类型 DVD-ROM 光驱描述 8X 显卡/音效显卡类型独立显卡显卡芯片 ATI Radeon X300 显存/位宽 64 显示屏屏幕尺寸 14.1英寸是否宽屏否屏幕描述 1024x768 尺寸/重量笔记本重量 2800g 外形尺寸 34*314*260 网络通信无线网卡无线网卡Intel PRO/Wireless 2200BG 网卡描述 1000Mbps以太网卡调制解调器 56K V.92 designed modem 鼠标/键盘键盘描述 Full size 接口其他接口 AC adapter Expansion Bus port (for Dock II/Mini Dock or Port Replicator II) External Display RJ11 RJ45 1个并口 IEEE1394 Microphone / Line in Infrared Headphone / Line out S-Video out 2 USB2.0 电源描述电池类型 6 Cell Lithium-Ion 续航时间 3.6 Hrs 其他操作系统中文Microsoft Windows XP家庭版质保时效 1年部件及人力（系统电池：1年）附带软件 Access Program, ThinkVantage Access Connections, ThinkVantage Rescue and Recovery Adobe Acrobat Reader 其他性能安全特性: Hard disk drive password Security Slot Supervisor password 加电口令

对r52只有3种系列，1858集成显卡，1846、1847 x300独显，所以看显卡就知道系列了。1847配置比较高，通常512m内存这是第一种笔记本品牌： ibm/thinkpad ibm系列型号： r52 产品参数详细信息--主要功能 cpu类型 dothan 标称频率 1600mhz cpu描述 fsb 533mhz 显示屏尺寸 14.1英寸显示屏描述 1024*768 内存类型 ddr2 内存大小 256mb 产品参数详细信息--存储性能硬盘大小 40gb 硬盘描述 ata-100 光驱类型 dvd-rom 光驱描述 8x 产品参数详细信息--视频/音频显卡描述 intel graphics media accelerator 900 音频系统 soundmax 产品参数详细信息--输入输出键盘全尺寸网卡 10m/100m/1000m网卡调制解调器 56k v.92 标准接口 2个usb2.0，红外，ieee 1394a，并口，vga接口，耳机接口，麦克风产品参数详细信息--电能规格电池类型 6 cell lithium-ion 电池时间 3小时产品参数详细信息--基本特征厚度 34mm 重量 2.8kg 产品参数详细信息--其他特性预装操作系统 microsoft windows xp 家庭版这是第二种 thinkpad r52 18465ec主要性能处理器品牌 intel 显示屏尺寸 14英寸笔记本处理器 intel 奔腾m 740 笔记本主频 1733mhz 迅驰技术迅驰2 二级缓存 2048kb 挑错笔记本芯片组 intel 915pm 系统总线频率 533mhz 内存类型 ddr2 标准内存容量 256mb 最大支持内存 2048mb thinkpad r52 18465ec存储性能硬盘容量 40gb 硬盘描述 ata-100 光驱类型 combo 光驱速度 8x hinkpad r52 18465ec显示屏显示屏类型 tft lcd 标准分辨率 1024×768 thinkpad r52 18465ec视频音频显卡芯片 ati mobility radeon x300 显存容量 64mb 音频系统 soundmax 内置音箱有 thinkpad r52 18465ec网络设备红外网卡 100/1000m以太网卡 modem 56k v.92 无线网卡 802.11b/g thinkpad r52 18465ec输入输出指取设备指点杆加触摸板 i/o接口 2 usb 2.0 ,ieee 1394,microphone/line in pcmcia槽数 1个,type ii thinkpad r52 18465ec特征参数笔记本重量 2.8kg 外观特征 34×314×260 机壳材料普通机壳 thinkpad r52 18465ec电能规格电池规格 6 cell lithium-ion 续航时间 3.6小时 thinkpad r52 18465ec随机配件预装操作系统 windows xp 家庭版这是第3种 ibm thinkpad r52 1846cc2 主要性能设计类型光驱可抽换 cpu类型奔腾-m(dothan-533) 迅驰技术支持标称频率 2ghz cpu描述 intel pentium m processor 760 主板描述 i915pm 屏幕尺寸 14.1英寸屏幕描述 1024x768 是否宽屏否内存类型 ddrii 内存大小 512mb 内存描述 pc2-4200 ddr2 sdram ibm thinkpad r52 1846cc2 存储性能硬盘大小 60gb 硬盘描述 ata-100 (enhanced ide) 光驱类型康宝光驱描述 24x/24x/24x/8x max 软驱描述无 ibm thinkpad r52 1846cc2 视频/音频显卡类型独立显卡显卡芯片 ati radeon x300 显存类型 ddr2 sdram 显存容量 64mb 音频系统 soundmax ibm thinkpad r52 1846cc2 输入输出鼠标描述 thinkpad ultranav 键盘描述 full size wlan性能 802.11a/b/g,intel pro/wireless 2200bg 网卡描述 1000mbps以太网卡调制解调器 56k 红外线红外线接口标准接口 ac adapter headphone / line out external display expansion bus port (for dock ii/mini dock or port replicator ii) infrared ieee1394 microphone / line in 1个并口 rj11 rj45 s-video out 2 usb2.0 ibm thinkpad r52 1846cc2 电能规格电池类型 6 cell lithium-ion 供电时间 3.6 hrs ibm thinkpad r52 1846cc2 基本特征外形尺寸 34*314*260 笔记本重量 2800g ibm thinkpad r52 1846cc2 其他特性操作系统中文microsoft windows xp家庭版上市日期 2005 附带软件 access program, thinkvantage access connections, thinkvantage rescue and recovery adobe acrobat reader 其他特点 ibm embedded security subsystem 2.0 绝对是出厂的配置

9，5大千万级设备市场技术拆解_

近一年各种深度学习平台和硬件层出不穷，各种xPU的功耗和面积数据也是满天飞，感觉有点乱。在这里我把我看到的一点情况做一些小结，顺便列一下可能的市场。在展开之前，我想强调的是，深度学习的应用无数，我能看到的只有能在千万级以上的设备中部署的市场，各个小众市场并不在列。

深度学习目前最能落地的应用有两个方向，一个是图像识别，一个是语音识别。这两个应用可以在如下市场看到：个人终端（手机，平板），监控，家庭，汽车，机器人和无人机。

手机和平板：安卓的天下，一定要紧跟谷歌爸爸

先说手机和平板。这个市场一年的出货量在30亿颗左右（含功能机），除苹果外总值300亿刀。手机主要玩家是苹果（3亿颗以下），高通（8亿颗以上），联发科（7亿颗以上），三星（1亿颗以下），海思（1亿颗），展讯（6亿颗以上），平板总共4亿颗左右。而28纳米工艺，量很大的话（1亿颗以上），工程费用可以摊的很低，平均1平方毫米的成本是8美分左右，低端4G芯片（4核）的面积差不多是50平方毫米以下，成本就是4刀。中端芯片（8核）一般在100平方毫米左右，成本8刀。16纳米以及往上，同样的晶体管数，单位成本会到1.5倍。

一般来说，手机的物料成本中，处理器芯片（含基带）价格占了1/6左右。一个物料成本90刀的手机，用的处理器一般在15刀以下，甚至只有10刀。这个10刀的芯片，包含了处理器，图形处理器，基带，图像信号处理器，每一样都是高科技的结晶，却和肯德基全家桶一个价，真是有点惨淡。然而，生产成本只是一部分，人力也是很大的开销。一颗智能机芯片，软硬开发，测试，生产，就算全用的成熟IP，也不会少于300人，每人算10万刀的开销，量产周期两年，需要6000万刀。外加各种EDA工具，IP授权和开片费，芯片还没影子，1亿刀就下去了。

言归正传，手机上的应用，最直接的就是美颜相机，AR和语音助手。这些需求翻译成硬件指令，就是对8位整数点乘（INT8）和16位浮点运算（FP16）的支持。具体怎么支持？曾经看到过一张图，我觉得较好的诠释了这一点：

智能手机和平板是安卓的天下，所有独立芯片商都必须跟着谷歌爸爸走。谷歌已经定义了Android NN作为上层接口，可以支持它的TensorFlow，以及专为移动设备定义的TensorFlow Lite。而下层，针对各种不同场景，可以是CPU，GPU，DSP，也可以是硬件加速器。它们的能效比如下图：

可以看到，在TSMC16纳米工艺下，大核能效比是10-100Gops/W（INT8），小核可以做到100G-1Tops/W，手机GPU是300Gops/W，而要做到1Tops/W以上，必须使用加速器。这里要指出的是，小核前端设计思想与大核完全不同，在后端实现上也使用不同的物理单元，所以看上去和大核的频率只差50%，但是在逻辑运算能效比上会差4倍以上，在向量计算中差的就更多了。

手机的长时间运行场景下，芯片整体功耗必须小于2.5瓦，分给深度学习任务的，不会超过1.5瓦。相对应的，如果做到1Tops/W，那这就是1.5T（INT8）的处理能力。对于照片识别而言，情况要好些，因为通常不需要长时间连续的处理。这时候，CPU是可以爆发然后休息的。语音识别对性能要求比较低，100Gops可以应付一般应用，用小核也足够。但有些连续的场景，比如AR环境识别，每秒会有30-60帧的图像送进来，如果不利用前后文帮助判断，CPU是没法处理的。此时，就需要GPU或者加速器上场。

上图是NVidia的神经网络加速器DLA，它只有Inference的功能。前面提到在手机上的应用，也只需要Inference来做识别，训练可以在服务端预先处理，训练好的数据下载到手机就行，识别的时候无需连接到服务端。

DLA绿色的模块形成类似于固定的流水线，上面有一个控制模块，可以用于动态分配计算单元，以适应不同的网络。稀疏矩阵压缩减少带宽，优化的矩阵算法减少计算量，外加SRAM（一个273x128, 128x128, 128x128 ,128x6 的4层INT8网络，需要70KB SRAM）。我看到的大多数加速器，其实都是和它大同小异，有些加速器增加了一个SmartDMA引擎，可以通过简单计算预取所需的数据。根据我看到的一些跑分测试，这个预取模块可以把计算单元的利用率提高到90%以上。

至于能效比，我看过的加速器，在支持INT8的算法下，可以做到 1.2 Tops/W (1Ghz@T16FFC)，1 Tops/mm^2，并且正在向1.5 Tops/W靠近。也就是说，1.5W可以获得2Tops (INT8) 的理论计算能力。这个计算能力有多强呢？我这目前处理1080p 60 FPS的图像中的60x60及以上的像素大小的人脸识别，大致需要0.5 Tops的计算能力，2Tops完全可以满足。当然，如果要识别复杂场景，那肯定是计算力越高越好。

为什么固定流水的能效比能做的高？ASIC的能效比远高于通用处理器已经是一个常识，更具体一些，DLA不需要指令解码，不需要指令预测，不需要乱序执行，流水线不容易因为等待数据而停顿。下图是某小核各个模块的动态功耗分布，计算单元只占1/3，而指令和缓存访问占了一半。

有了计算量，深度学习加速器对于带宽的需求是多少？如果SRAM足够大，1Tops的计算量需要5GB/s以下的带宽。连接方法可以放到CPU的加速口ACP （跑在1.8 GHz的ARMv 8.2内部总线可以提供9 GB/s带宽）。只用一次的数据可以设成非共享类型，需要和CPU交换或者常用的数据使用Cacheable和Shareable类型，既可以在三级缓存分配空间，还可以更高效的做监听操作，免掉刷缓存。

不过，上述前提成立的前提是权值可以全部放到SRAM或者缓存。对于1Tops INT8的计算量，所需权值的大小是512 GB/s（有重复）。如果全部放DDR，由于手机的带宽最多也就是30 GB/S，是完全不够看的。对于输入，中间值和输出数据，我在上文有个例子，一个273x128,128x128, 128x128 ,128x6 的4层INT8网络，需要70KB的SRAM（片内）放权值，共7万个。但是输入，输出和中间结果加起来却只有535个，相对来说并不大。这里的运算量是14万次（乘和加算2次）。对于1T的运算量来说，类似。中间数据放寄存器，输出数据无关延迟，只看带宽，也够。最麻烦的就是权值，数据量大到带宽无法接受。所以，只能把权值放进SRAM防止重复读取，从而免掉这500GB/s带宽。我看到的有些深度学习的算法，权值在几十到200兆，这样无论如何是塞不进SRAM的。哪怕只有10%需要读入，那也是50GB/s的带宽。虽说现在有压缩算法压缩稀疏矩阵，有论文达到30-50倍的压缩率，但我看到的实际识别算法，压缩后至少也是20MB，还是塞不进SRAM。

图像识别/美颜相机：目前80%的图像、视频任务都是用CPU在处理

此外，移动端仅仅有神经网络加速器是远远不够的。比如要做到下图效果，那首先要把人体的各个细微部位精确识别，然后用各种图像算法来打磨。而目前主流图像算法和深度学习没有关系，也没看到哪个嵌入式平台上的加速器在软件上有很好的支持。目前图像算法的支持平台还主要是PC和DSP，连嵌入式GPU做的都一般。

那这个问题怎么解决？我看到两种思路：

第一种，GPU内置加速器。下图是Verisilicon的Vivante改的加速器，支持固定流水的加速器和可编程模块Vision core（类似GPU中的着色器单元），模块数目可配，可以同时支持视觉和深度学习算法。不过在这里，传统的图形单元被砍掉了，以节省功耗和面积。只留下调度器等共用单元，来做异构计算的调度。

这类加速器比较适合于低端手机，自带的GPU和CPU本身并不强，可能光支持1080p的UI就已经耗尽GPU资源了，需要额外的硬件模块来完成有一定性能需求的任务。

第二种，对于中高端手机，GPU和CPU的资源在不打游戏的时候有冗余，那么就没有必要去掉图形功能，直接在GPU里面加深度学习加速器就可以，让GPU调度器统一调度，进行异构计算。

上图是某款GPU的材质计算单元，你有没有发现，其实它和神经网络加速器的流水线非常类似？都需要权值，都需要输入，都需要FP16和整数计算，还有数据压缩。所不同的是计算单元的密度，还有池化和激活。稍作改动，完全可以兼容，从而进一步节省面积。

但是话说回来，据我了解，目前安卓手机上各种图像，视频和视觉的应用，80%其实都是用CPU在处理。而谷歌的Android NN，默认也是调用CPU汇编。当然，手机芯片自带的ISP及其后处理，由于和芯片绑的很紧，还是能把专用硬件调动起来的。而目前的各类加速器，GPU，DSP，要想和应用真正结合，还有挺长的路要走。

AR：如果不复杂，对CPU和GPU的性能要求并不高

终端设备上还有一个应用，AR。据说iPhone 8会实现这个功能，如果是的话，那么估计继2015的VR/AR，2016的DL，2017的NB-IOT之后，2018年又要回锅炒这个了。

那AR到底用到哪些技术？我了解的如下，先是用深度传感器得到场景深度信息，然后结合摄像头拍到的2D场景，针对某些特定目标（比如桌子，面部）构建出一个真实世界的3D物体。这其中需要用到图像识别来帮助判断物体，还需要确定物体边界。有了真实物体的三维坐标，就可以把所需要渲染的虚拟对象，贴在真实物体上。然后再把摄像头拍到的整个场景作为材质，贴到背景图层，最后把所有这些图层输出到GPU或者硬件合成器，合成最终输出。这其中还需要判断光源，把光照计算渲染到虚拟物体上。这里每一步的计算量有多大？

首先是深度信息计算。获取深度信息目前有三个方法，双目摄像头，结构光传感器，还有TOF。它们分别是根据光学图像差异，编码后的红外光模板和反射模板差异，以及光脉冲飞行时间来得到深度信息。第一个的缺点是需要两个摄像头之间有一定距离，并且对室内光线亮度有要求；第二个需要大量计算并且室外效果不佳；第三个方案镜头成本较高。据说苹果会用结构光方案，主要场景是室内，避免了缺点。结构光传感器的成本在2-3刀之间，也是可以接受的。而对于计算力的要求，最基本的是对比两个经过伪随机编码处理过的发射模板以及接受模板，计算出长度差，然后用矩阵倒推平移距离，从而得到深度信息。这可以用专用模块来处理，我看到单芯片的解决方案，720p 60FPS的处理能力，需要20GFLOPS FP32的计算量以上。换成CPU，就是8核。当然，我们完全可以先识别出目标物体，用图像算法计算出轮廓，还可以降低深度图的精度（通常不需要很精确），从而大大降低计算量。而识别本身的计算量前文已经给出，计算轮廓是经典的图像处理手段，针对特定区域的话计算量非常小，1-2个核就可以搞定。

接下去是根据深度图，计算真实物体的三维坐标，并输出给GPU。这个其实就是GPU渲染的第一阶段的工作，称作顶点计算。在移动设备上，这部分通常只占GPU总计算量的10%，后面的像素计算才是大头。产生虚拟物体的坐标也在这块，同样也很轻松。

接下去是生成背景材质，包括产生minimap等。这个也很快，没什么计算量，把摄像头传过来的原始图像放到内存，告诉GPU就行。

稍微麻烦一些的是计算虚拟物体的光照。背景贴图的光照不需要计算，使用原图中的就可以。而虚拟物体需要从背景贴图抽取亮度和物体方向，还要计算光源方向。我还没有见过好的算法，不过有个取巧，就是生成一个光源，给一定角度从上往下照，如果对AR要求不高也凑合了。

其他的渲染部分，和VR有些类似，什么ATW啊，Front Buffer啊，都可以用上，但是不用也没事，毕竟不是4K 120FPS的要求。总之，AR如果做的不那么复杂，对CPU和GPU的性能要求并不高，搞个图像识别模块，再多1-2个核做别的足矣。

如果加速器在GPU上，那么还是得用传统的ACE口，一方面提高带宽，一方面与GPU的核交换数据在内部进行，当然，与CPU的交互必然会慢一些。

在使用安卓的终端设备上，深度学习可以用CPU/DSP/GPU，也可以是加速器，但不管用哪个，一定要跟紧谷歌爸爸。谷歌以后会使用 Vulkan Compute来替代OpenCL，使用Vulkan 来替代OpenGL ES，做安卓GPU开发的同学可以早点开始熟悉了。

高通推过用手机做训练，然后手机间组网，形成强大的计算力。从我的角度看，这个想法问题多多，先不说实际应用，谁会没事开放手机给别人训练用？耗电根本就吃不消。并且，要是我知道手机偷偷上传我的图像和语音模板到别人那里，绝对不会买。

家庭市场（智能音箱）：语义识别放在云端还是终端，将成争夺的焦点

第二个市场是家庭，包括机顶盒/家庭网关（4亿颗以下），数字电视（3亿颗以下），电视盒子（1亿以下）三大块。整个市场出货量在7亿片，电器里面的MCU并没有计算在内。这个市场公司比较散，MStar/ 海思/博通/ Marvell / Amlogic都在里面，小公司更是无数。如果没有特殊要求，拿平板的芯片配个wifi就可以用。当然，中高端的对画质还是有要求，MTK现在的利润从手机移到了电视芯片，屏幕显示这块有独到的技术。很多机顶盒的网络连接也不是以太网，而是同轴电缆等，这种场合也得专门的芯片。

最近，这个市场里又多了一个智能音箱，各大互联网公司又拿出当年追求手机入口的热情来布局，好不热闹。主要玩家如下：

其中，亚马逊和谷歌占大头，芯片均采用ARM Cortex-A小核做控制器，DSP做图像和语音处理的方式。其中，DSP的运算能力在10 Gops的INT8 MAC左右，并不高，价格却不便宜，大于20美金。在芯片内部，DSP的主要作用还是回声消除，去噪，语音识别等。自然语言理解和神经网络计算并不是在设备端，而是在云端。在国内，百度和科大讯飞提供SDK甚至模块，不过还是需要连到云端才能启用完整功能。在芯片方面，国内有些公司已经发布了一些带深度学习加速器的芯片，并集成语音处理模块和内存颗粒。未来这类芯片会更多，而软件平台，或者说语义处理到底放在云端还是终端，会成为争夺的焦点。

对于语音设别，如果是需要做自然语言理解，性能可能要到100Gops。对于无风扇设计引入的3瓦功耗限制，CPU/DSP和加速器都可以选。不过工艺就得用28纳米了或者更早的了，毕竟没那么多量，撑不起16纳米。最便宜的方案，可以使用RISC-V+DLA，没有生态系统绑定的情况下最省成本。

家庭电子设备里还有一个成员，游戏机。Xbox和PS每年出货量均在千万级别。VR/AR和人体识别早已经用在其中。

监控市场：能不能扔掉DSP？

接下去是监控市场。监控市场上的图像识别是迄今为止深度学习最硬的需求。监控芯片市场本身并不大，有1亿颗以上的量，销售额20亿刀左右。主流公司有安霸，德州仪器和海思，外加几个小公司，OEM自己做芯片的也有。

传统的监控芯片数据流如上图蓝色部分，从传感器进来，经过图像信号处理单元，然后送给视频编码器编码，最后从网络输出。如果要对图像内容进行识别，那可以从传感器直接拿原始数据，或者从ISP拿处理过的图像，然后进行识别。中高端的监控芯片中还会有个DSP，做一些后处理和识别的工作。现在深度学习加速器进来，其实和DSP是有些冲突的。以前的一些经典应用，比如车牌识别等，DSP其实就已经做得很好了。如果要做识别以外的一些图像算法，这颗DSP还是得在通路上，并不能被替代。并且，DSP对传统算法的软件库支持要好得多。这样，DSP替换不掉，额外增加处理单元在成本上就是一个问题。

对于某些低功耗的场景，我看到有人在走另外一条路。那就是完全扔掉DSP，放弃存储和传输视频及图像，加入加速器，只把特征信息和数据通过NB-IOT上传。这样整个芯片功耗可以控制在500毫瓦之下。整个系统结合传感器，只在探测到有物体经过的时候打开，平时都处于几毫瓦的待机状态。在供电上，采用太阳能电池，100mmx100mm的面板，输出功率可以有几瓦。不过这个产品目前应用领域还很小众。

做识别的另一个途径是在局端。如果用显卡做，GFX1080的FP32 GLOPS是9T，180瓦，1.7Ghz，16纳米，320mm。而一个Mali G72MP32提供1T FP32的GFLOPS，16纳米，850Mhz，8瓦，9T的话就是72瓦，666mm。当然，如果G72设计成跑在1.7Ghz，我相信不会比180瓦低。此外桌面GPU由于是Immediate rendering的，带宽大，但对缓存没有很大需求，所以移动端的GPU面积反而大很多，但相对的，它对于带宽需求小很多，相应的功耗少很多。

GPU是拿来做训练的，而视频识别只需要做Inference，如果用固定流水的加速器，按照NVIDIA Tesla P40的数据，48T INT8 TOPS，使用固定流水加速器，在16nm上只需要48mm。48Tops对应的识别能力是96路1080p60fps，96路1080p60fps视频解码器对应的面积差不多是50mm，加上SRAM啥的，估计200mm以下。如果有一千万的量，那芯片成本可以做到40美金以下（假定良率还可以，不然路数得设计的小一点），而一块Tesla P40板子的售价是500美金（包括DDR颗粒），还算暴利。国内现在不少小公司拿到了投资在做这块的芯片。

机器人和无人机

第四个市场是机器人/无人机。机器人本身有多少量我没有数据，手机和平板的芯片也能用在这个领域。无人机的话全球一年在200万左右，做视觉处理的芯片也应该是这个量级。无人机用到的识别模块目前看还是DSP和CPU为主，因为DSP还可以做很多图像算法，和监控类似。这个市场对于ISP和深度信息的需求较高，双摄和结构光都可以用来算深度计算，上文提过就不再展开。

在无人机上做ISP和视觉处理，除了要更高的清晰度和实时性外，还比消费电子多了一个要求，容错。无人机的定位都靠视觉，如果给出的数据错误或者模块无反应都不符合预期。解决这个问题很简单，一是增加各种片内存储的ECC和内建自检，二是设两个同样功能的模块，错开时钟输入以避免时钟信号引起的问题，然后输出再等相同周期，同步到一个时钟。如果两个结果不一致，那就做特殊处理，避免扩散数据错误。

汽车：300亿美元芯片市场，容错能力需要系统化升级

第五个市场是汽车，整个汽车芯片市场近300亿刀，玩家众多：

在汽车电子上，深度学习的应用就是ADAS了。在ADAS里面，语音和视觉从技术角度和前几个市场差别不大，只是容错这个需要进一步系统化，形成Function Safety，整个软硬件系统都需要过认证，才容易卖到前装市场。Function Safety比之前的ECC/BIST/Lock Step更进一步，需要对整个芯片和系统软件提供详细的测试代码和文档，分析在各类场景下的错误处理机制，连编译器都需要过认证。认证本身分为ASIL到A-ASIL-D四个等级，最高等级要求系统错误率小于1%。我对于这个认证并不清楚，不过国内很多手机和平板芯片用于后装市场的ADAS，提供语音报警，出货量也是过百万的。

最后放一张ARM的ADAS参考设计框图。

可能不会有人照着这个去设计ADAS芯片，不过有几处可以借鉴：

右方是安全岛，内涵Lock Step的双Cortex-R52，这是为了能够保证在左边所有模块失效的情况下复位整个系统或者进行异常中断处理的。中部蓝色和绿色的CryptoCell模块是对整个系统运行的数据进行保护，防止恶意窃取的。关于Trustzone设计这里就不展开了。

服务器及其他市场：

以上几个市场基本都是Inference的需求，其中大部分是对原有产品的升级，只有ADAS，智能音箱和服务器端的视频识别检测是新的市场。其中智能音箱达到了千万级别，其他的两个还都在扩张。

接下去的服务端的训练硬件，可以用于训练的移动端GPU每个计算核心面积是1.5mm (TSMC16nm)，跑在1Ghz的时候能效比是300Gops/W。其他系统级的性能数据我就没有了。虽然这个市场很热，NVidia的股票也因此很贵，但是我了解到全球用于深度学习训练的GPU销售额，一年只有1亿刀不到。想要分一杯羹，可能前景并没有想象的那么好。

最近970发布，果然上了寒武纪。不过2Tops FP16的性能倒是让我吃了一惊，我倒推了下这在16nm上可能是6mm的面积，A73MP4+A53MP4（不含二级缓存）也就是这点大小。麒麟芯片其实非常强调面积成本，而在高端特性上这么舍得花面积，可见海思要在高端机上走出自己的特色之路的决心，值得称道。不过寒武纪既然是个跑指令的通用处理器，那除了深度学习的计算，很多其他场合也能用上，比如ISP后处理，计算结构光深度信息等等，能效可能比DSP还高些。