上海交大教授张伟楠称,国产芯片如华为昇腾384有望与美国顶级芯片抗衡甚至超越。通过构建超级集群,中国可以在集中集成式算力方面实现曲线救国。
最近,DeepSeek-OCR模型被推出,这种模型的压缩率是大语言模型的10倍。这种技术有可能成为游戏规则制定的关键者和变化者。未来5年对中国将是一个革命性的机会,无论是中国还是美国的一些议员还是顶级的大厂都会重视中美之间博弈的差距。
然而,底层芯片带来的弱势将在接下来的几年内被极大地替代掉,被 revolution掉。中国的AI发展正在获得快速进展,这取决于我们如何利用底层芯片和数据中心来推动这个领域的发展。
最近,华为首次线下展出昇腾384超节点,即Atlas 900 A3 SuperPoD。这是一种基于超节点架构的产品,它通过总线技术实现384个NPU之间的大带宽低时延互联,解决集群内计算、存储等各资源之间的通信瓶颈。
华为的AI算力集群解决方案CloudMatrix 384基于384颗昇腾芯片构建,通过全互连拓扑架构实现芯片间高效协同,可提供高达300 PFLOPs的密集BF16算力。它在内存容量和带宽方面同样占据优势,总内存容量超出英伟达方案3.6倍,内存带宽也达到2.1倍,为大规模AI训练和推理提供了更高效的硬件支持。
尽管单颗昇腾芯片性能约为英伟达Blackwell架构GPU的三分之一,但华为通过规模化系统设计成功实现整体算力跃升,并在超大规模模型训练、实时推理等场景中展现更强竞争力。
最近,DeepSeek-OCR模型被推出,这种模型的压缩率是大语言模型的10倍。这种技术有可能成为游戏规则制定的关键者和变化者。未来5年对中国将是一个革命性的机会,无论是中国还是美国的一些议员还是顶级的大厂都会重视中美之间博弈的差距。
然而,底层芯片带来的弱势将在接下来的几年内被极大地替代掉,被 revolution掉。中国的AI发展正在获得快速进展,这取决于我们如何利用底层芯片和数据中心来推动这个领域的发展。
最近,华为首次线下展出昇腾384超节点,即Atlas 900 A3 SuperPoD。这是一种基于超节点架构的产品,它通过总线技术实现384个NPU之间的大带宽低时延互联,解决集群内计算、存储等各资源之间的通信瓶颈。
华为的AI算力集群解决方案CloudMatrix 384基于384颗昇腾芯片构建,通过全互连拓扑架构实现芯片间高效协同,可提供高达300 PFLOPs的密集BF16算力。它在内存容量和带宽方面同样占据优势,总内存容量超出英伟达方案3.6倍,内存带宽也达到2.1倍,为大规模AI训练和推理提供了更高效的硬件支持。
尽管单颗昇腾芯片性能约为英伟达Blackwell架构GPU的三分之一,但华为通过规模化系统设计成功实现整体算力跃升,并在超大规模模型训练、实时推理等场景中展现更强竞争力。