​​陈天石:开拓 AI 芯片算力的寒武纪科技领航者​​!

寒武纪 陈天石 人物传记
发布于 2025-09-12

2016年,北京中关村一间普通的办公室里,32岁的陈天石盯着电脑屏幕上的芯片架构图,手指无意识地敲着键盘。这位中科院计算所的副研究员,刚刚做出了一个让学术圈震惊的决定——放弃中科院的“铁饭碗”,和他的哥哥陈云霁(时任中科院计算所研究员)一起,创办一家专注于AI芯片的公司。

“当时很多人觉得我们疯了。”多年后陈天石在接受采访时坦言,“但我知道,AI的爆发已经到了,而算力会成为最关键的瓶颈。”


一、学术基因:从中科院实验室到“芯片梦”的萌芽

陈天石的技术底色,深深烙着中科院计算所的印记。他1985年出生于江西南昌,16岁考入中科大少年班,25岁获中国科学技术大学计算机科学博士学位,随后进入中科院计算所工作,师从计算机体系结构领域权威胡伟武教授(龙芯芯片核心研发者)。

在计算所的十年里,陈天石的研究方向是“处理器设计与人工智能交叉”。他主导过“龙芯”芯片的性能优化项目,也参与过深度学习算法在传统芯片上的适配研究。但越深入,他越意识到一个关键问题: 传统通用芯片(如CPU、GPU)在AI任务中效率低下,算力浪费严重

“做AI训练时,一块GPU的功耗相当于一台空调,但真正用于计算的能耗可能不到10%。”陈天石曾在内部会议上举例,“我们需要为AI‘量身定制’的芯片。”

2014年,陈天石与哥哥陈云霁合作发表论文《DianNao:一种小尺度的高吞吐率机器学习加速器》,在国际学术界引发轰动。这篇论文提出了一种专为深度学习设计的专用芯片架构,相比传统GPU,计算效率提升近百倍,功耗降低70%。

论文发表后,美国斯坦福大学、MIT等机构纷纷抛来橄榄枝,邀请陈天石加盟。但他的选择出人意料:“中国的AI产业需要自己的算力底座,与其在国外做研究,不如回来做实事。”


二、创业维艰:从“纸上的架构”到“能用的芯片”

2016年3月,寒武纪科技在中关村正式注册成立,初始团队只有7人——陈天石、陈云霁,加上5名从计算所出来的工程师。公司成立仪式简单到只有一桌盒饭,陈天石在黑板上写下:“做世界最好的AI芯片。”

但现实比理想残酷得多。

1. 第一桶金:用“学术成果”敲开市场大门

创业初期,寒武纪没有产品、没有收入,连办公室租金都要靠陈天石的个人积蓄垫付。转机出现在2016年夏天——华为海思的研发总监在一次学术会议上听说了陈天石团队的DianNao架构,主动找上门来。

“我们需要一款能适配手机AI功能的专用芯片。”华为的需求很明确:低功耗、高算力,能在手机端实现实时图像识别、语音助手等功能。

陈天石团队用了4个月时间,基于DianNao架构开发出第一代芯片原型机。测试结果显示:这款芯片在手机AI任务中的能效比(每瓦特算力)是同期高通骁龙芯片的3倍。

2017年,华为麒麟970芯片搭载寒武纪1A处理器(MLU100)正式发布,成为全球首款内置独立AI芯片的手机SoC。这款芯片让华为Mate 10系列手机的AI拍照、语音交互功能远超同期竞品,也让寒武纪在行业内一战成名。

“那是我们第一次真正把论文里的架构变成了能落地的芯片。”陈天石后来回忆,“华为的信任让我们明白:学术成果只有解决产业问题,才有价值。”

2. 流片失败:凌晨三点的“芯片急救”

2018年,寒武纪启动首款云端AI芯片“思元100”的研发。但芯片行业有个残酷的规律: 流片(芯片试生产)失败率高达60%,每一次失败都意味着数百万元打水漂。

“第一次流片回来时,测试数据完全不对。”寒武纪硬件负责人王磊(化名)记得,那天凌晨三点,团队挤在实验室里看测试报告,陈天石揉着发红的眼睛说:“拆了重来。”

为了定位问题,团队连续72小时排查电路设计,最终发现是一个时钟信号干扰的细节错误。“陈总亲自画了新的电路图,和我们一起改了三轮版图。”王磊说,“他常说,芯片是‘细节的艺术’,差0.1毫米都可能前功尽弃。”

2018年5月,思元100正式发布,采用16nm工艺,算力达到256TOPS(INT8),支持主流AI框架。这款芯片不仅填补了国内云端AI芯片的空白,更让寒武纪成为全球AI芯片领域“四小龙”(寒武纪、地平线、比特大陆、云知声)之一。


三、突围之路:从“单品爆款”到“生态战争”

2019年,寒武纪的发展进入快车道:思元270芯片发布,算力提升至512TOPS;与浪潮、曙光等服务器厂商合作,推出基于寒武纪芯片的AI服务器;中标中国移动、中国电信的智能计算设备采购项目……

但陈天石的危机感从未消失。“AI芯片市场太大了,但竞争也更激烈。”他在内部信中写道,“英特尔、英伟达、AMD都在加码AI芯片,我们不能只做‘单项冠军’,必须构建生态。”

1. 对抗“英伟达生态”:从“兼容”到“开放”

英伟达的CUDA生态是AI芯片领域的“护城河”——全球90%的AI开发者基于CUDA编写代码,换用其他芯片意味着重新学习一套工具链。

寒武纪的做法是“两条腿走路”:一方面兼容CUDA,降低开发者迁移成本;另一方面推出自研的“寒武纪智能计算平台”(Cambricon Neuware),提供从芯片指令集、开发框架到应用工具的全栈支持。

“我们希望开发者用寒武纪的芯片时,能像用手机APP一样简单。”寒武纪软件负责人李雪(化名)记得,为了让工具链更易用,团队曾为一个调试接口优化了20版代码,“陈总说,生态不是口号,是开发者用脚投票的结果。”

2. 行业痛点:从“卖芯片”到“卖解决方案”

2020年,寒武纪遇到了一次重大挑战:某头部云服务商采购了寒武纪芯片,但反馈“实际算力达标称值的80%”。

陈天石带着技术团队驻场排查,发现问题出在客户的算法与芯片架构不匹配。“客户用的是通用深度学习模型,而我们的芯片对特定模型(如图像分类)做了优化。”他说,“这让我们意识到:卖芯片不如卖‘芯片+算法+服务’的整体方案。”

此后,寒武纪调整策略,针对智慧城市、智能制造、自动驾驶等场景推出定制化解决方案。例如,在深圳的“城市智能中枢”项目中,寒武纪芯片与交通管理算法深度绑定,将路口视频分析的延迟从500ms降低至80ms,支撑起2000路摄像头的实时调度。


四、暗战与坚持:在巨头阴影下“长出自己的根”

2021年,寒武纪在科创板上市,首日市值突破千亿元,成为“AI芯片第一股”。但光环背后,挑战才刚刚开始:

  • 国际巨头的挤压:英伟达A100、H100芯片凭借成熟的生态和强大的算力,占据全球数据中心市场70%以上的份额;
  • 国内同行的追赶:华为昇腾、百度昆仑、壁仞等芯片相继问世,市场竞争白热化;
  • 盈利难题:芯片研发投入大、回报周期长,寒武纪2019-2022年累计亏损超30亿元。

面对质疑,陈天石在一次财报会上回应:“做芯片就像种果树,前五年浇水施肥,第六年才会结果。我们现在的每一行代码、每一版流片,都是在为未来十年的生态打基础。”

他带领团队押注“边缘计算”和“智能驾驶”两个新赛道:2022年发布思元370芯片,支持800V高压平台,适配自动驾驶域控制器;2023年推出“寒武纪行歌”车载芯片品牌,与吉利、哪吒等车企合作,推进L3级自动驾驶落地。


五、未来:做“中国智能时代的算力基石”

如今,寒武纪的芯片已广泛应用于云端、边缘端、终端三大场景:在阿里云的AI训练平台上,思元芯片支撑着千万级模型的训练;在杭州的“城市大脑”中,边缘端芯片实时处理着交通、安防数据;在某新能源车企的自动驾驶测试车上,车载芯片让车辆能在复杂路况下做出毫秒级决策。

陈天石的办公室里,至今挂着一块白板,上面写着:“芯片的本质是数学问题。”他常对团队说:“我们不是在做‘电子消费品’,是在做‘数字时代的工业粮食’。”

“有人问我,后悔放弃中科院的安稳吗?”陈天石笑着说,“当你看到自己设计的芯片驱动着城市的智能运转,支撑着自动驾驶汽车安全行驶,甚至助力药物研发的AI模型加速迭代——这种成就感,比发100篇论文都强。”



结语

从学术实验室到科创板,从“DianNao”论文到全球AI芯片独角兽,陈天石的故事,是中国AI芯片产业从“0到1”的缩影。他没有“造富神话”的光环,却用十年时间证明:真正的核心技术,需要坐得住冷板凳的坚持,更需要“把论文写在产业里”的担当。在智能时代的浪潮中,寒武纪或许不是最大的那艘船,但一定是锚定最深海域的“算力基石”。


联系我们
社群交流