跳到主要内容

AI 大模型职业选择

AI 大模型这么火,我能参与其中么?又该怎么参与呢?

如果你也有同样的困惑,不妨让我们一起静下心来,慢慢理清思路,找到属于自己的方向。

AI 大模型职业方向

AI 大模型从训练到推理的路径,

AI 算法 -> AI Infra(基础设施) -> AI 编译器 -> AI 芯片

这也就有了四个方向。

  • AI 算法:本质是实验科学。门槛在于顶会论文、数学功底和试错成本。岗位供需严重失衡,是典型的红海。
  • AI 芯片:本质是硬件工程。门槛在于架构设计、Verilog/VHDL 和流片经验,掌握在少数巨头手中,学历门槛极高。
  • AI Infra 与编译器:本质是系统工程。它拼的是工程能力、对性能的极致追求和全局视野,这是靠时间与经验积累起来的壁垒。

AI 算法和芯片是“造梦者”和“筑梦者”,而 AI Infra 与编译器则是“送梦者”。大模型的落地,最终要靠系统工程让模型变得稳定、高效、便宜。这条路门槛也不低,但胜在积累,走得踏实。

四个方向,四种人生

这四个方向,供需关系目前存在结构性失衡。

AI 算法人才(供过于求的“红海”)

  • 现状:入门的技术门槛看似不高(掌握 NumPy, PyTorch 即可上手),但这导致了大量人才的涌入,使得初级岗位的竞争异常激烈。
  • 紧俏度:结构性过剩。顶尖的、能发顶会论文、能设计全新架构的算法专家依然稀缺,但普通的、只会调参和套用模型的算法工程师,市场供应已经非常充足,甚至过剩。

AI 芯片人才(高精尖的“深潭”)

  • 现状:门槛最高,需要深厚的硬件知识(计算机体系结构、数字电路、Verilog/VHDL),且集中在少数头部公司(如 NVIDIA、AMD、华为昇腾、地平线等)。岗位数量相对有限,且对学历和背景要求极高。
  • 紧俏度:高精尖稀缺。他们是“硬核”稀缺,但因为培养难度极大、岗位总量少,普通开发者很难进入。

AI Infra 与编译器人才(极度紧缺的“蓝海”)

  • 现状:需求井喷,但供给严重不足。一个能熟练使用 CUDA 进行性能优化、或者能为 PyTorch 提交高质量代码的工程师,是所有 AI 公司都争抢的对象。很多公司甚至开出了比同级别算法工程师更高的薪水来招募 Infra 人才。
  • 紧俏度:极度紧缺。在这个领域,不需要和成千上万的应届生竞争同一个岗位。只是在和少数同样具备系统工程思维的开发者竞争,而市场上的坑位远比合格的人才多。

总结,

方向核心工作适合人群竞争格局地域分布
AI 算法模型设计、调参、论文复现数学功底强、顶会选手❌ 红海内卷一线城市集中
AI 芯片硬件架构、Verilog设计体系结构背景、名校科班🔷 高精尖稀缺少数头部公司
AI Infra分布式训练、推理优化、K8s调度后端/系统工程师、实战派🔥 极度紧缺需求分散,机会增多
AI 编译器图优化、算子融合、MLIR/TVM编译原理背景、底层控🔥 极度紧缺可远程,社区驱动

AI Infra 和编译器的人才紧俏,本质上是因为:

  • 它们是决定大模型能否落地的关键。
    • 没有好的Infra,再牛的模型也只能躺在实验室里;没有好的编译器,算法就无法在各类芯片上高效运行。
  • 它们是目前大模型成本问题的核心解。
    • 在追求模型效果的时代,算法最重要;但在追求规模化应用和盈利的时代,成本和效率最重要,而这就是 Infra 和编译器的战场。

如果说 AI 算法和芯片是“塔尖”和“塔基”,那 AI Infra 和编译器就是连接两者的“塔身”,而这个“塔身”目前正处于严重的“用工荒”状态。

认识自己,找准方向

以我举例:普通学历、普通开发,不过有十几年经验,都不清楚算好算坏。

对我来说:AI Infra 和编译器就是我这样的普通开发者进入 AI 大模型行业的“黄金入口”。

如何入行?

  • 打好地基:深入理解系统(内存、网络、IO)
  • 抓住一个点突破:分布式训练、Triton + RISC-V 等
  • 工具链加持:学会用 Profiler(Nsight、Perf)说话
  • 社区入场券:从提 PR 开始,让代码为我代言

二线城市!

  • 本地机会挖掘:超算中心/半导体/IoT,或等发展
  • 工作能力建设:开源贡献+技术博客+精准连接
  • 小成本实验法:云上几百元买来的分布式训练学习

如果你和我情况不同,无论职业方向还是学习路径,都可以咨询 AI 了。

结语:AI 的下半场

AI 大模型的上半场是算法的狂欢,下半场拼的是工程落地。与其在红海里卷算法,不如在蓝海里建壁垒。