AI 大模型职业选择
AI 大模型这么火,我能参与其中么?又该怎么参与呢?
如果你也有同样的困惑,不妨让我们一起静下心来,慢慢理清思路,找到属于自己的方向。
AI 大模型职业方向
AI 大模型从训练到推理的路径,
AI 算法 -> AI Infra(基础设施) -> AI 编译器 -> AI 芯片
这也就有了四个方向。
- AI 算法:本质是实验科学。门槛在于顶会论文、数学功底和试错成本。岗位供需严重失衡,是典型的红海。
- AI 芯片:本质是硬件工程。门槛在于架构设计、Verilog/VHDL 和流片经验,掌握在少数巨头手中,学历门槛极高。
- AI Infra 与编译器:本质是系统工程。它拼的是工程能力、对性能的极致追求和全局视野,这是靠时间与经验积累起来的壁垒。
AI 算法和芯片是“造梦者”和“筑梦者”,而 AI Infra 与编译器则是“送梦者”。大模型的落地,最终要靠系统工程让模型变得稳定、高效、便宜。这条路门槛也不低,但胜在积累,走得踏实。
四个方向,四种人生
这四个方向,供需关系目前存在结构性失衡。
AI 算法人才(供过于求的“红海”)
- 现状:入门的技术门槛看似不高(掌握 NumPy, PyTorch 即可上手),但这导致了大量人才的涌入,使得初级岗位的竞争异常激烈。
- 紧俏度:结构性过剩。顶尖的、能发顶会论文、能设计全新架构的算法专家依然稀缺,但普通的、只会调参和套用模型的算法工程师,市场供应已经非常充足,甚至过剩。
AI 芯片人才(高精尖的“深潭”)
- 现状:门槛最高,需要深厚的硬件知识(计算机体系结构、数字电路、Verilog/VHDL),且集中在少数头部公司(如 NVIDIA、AMD、华为昇腾、地平线等)。岗位数量相对有限,且对学历和背景要求极高。
- 紧俏度:高精尖稀缺。他们是“硬核”稀缺,但因为培养难度极大、岗位总量少,普通开发者很难进入。
AI Infra 与编译器人才(极度紧缺的“蓝海”)
- 现状:需求井喷,但供给严重不足。一个能熟练使用 CUDA 进行性能优化、或者能为 PyTorch 提交高质量代码的工程师,是所有 AI 公司都争抢的对象。很多公司甚至开出了比同级别算法工程师更高的薪水来招募 Infra 人才。
- 紧俏度:极度紧缺。在这个领域,不需要和成千上万的应届生竞争同一个岗位。只是在和少数同样具备系统工程思维的开发者竞争,而市场上的坑位远比合格的人才多。
总结,
| 方向 | 核心工作 | 适合人群 | 竞争格局 | 地域分布 |
|---|---|---|---|---|
| AI 算法 | 模型设计、调参、论文复现 | 数学功底强、顶会选手 | ❌ 红海内卷 | 一线城市集中 |
| AI 芯片 | 硬件架构、Verilog设计 | 体系结构背景、名校科班 | 🔷 高精尖稀缺 | 少数头部公司 |
| AI Infra | 分布式训练、推理优化、K8s调度 | 后端/系统工程师、实战派 | 🔥 极度紧缺 | 需求分散,机会增多 |
| AI 编译器 | 图优化、算子融合、MLIR/TVM | 编译原理背景、底层控 | 🔥 极度紧缺 | 可远程,社区驱动 |
AI Infra 和编译器的人才紧俏,本质上是因为:
- 它们是决定大模型能否落地的关键。
- 没有好的Infra,再牛的模型也只能躺在实验室里;没有好的编译器,算法就无法在各类芯片上高效运行。
- 它们是目前大模型成本问题的核心解。
- 在追求模型效果的时代,算法最重要;但在追求规模化应用和盈利的时代,成本和效率最重要,而这就是 Infra 和编译器的战场。
如果说 AI 算法和芯片是“塔尖”和“塔基”,那 AI Infra 和编译器就是连接两者的“塔身”,而这个“塔身”目前正处于严重的“用工荒”状态。
认识自己,找准方向
以我举例:普通学历、普通开发,不过有十几年经验,都不清楚算好算坏。
对我来说:AI Infra 和编译器就是我这样的普通开发者进入 AI 大模型行业的“黄金入口”。
如何入行?
- 打好地基:深入理解系统(内存、网络、IO)
- 抓住一个点突破:分布式训练、Triton + RISC-V 等
- 工具链加持:学会用 Profiler(Nsight、Perf)说话
- 社区入场券:从提 PR 开始,让代码为我代言
二线城市!
- 本地机会挖掘:超算中心/半导体/IoT,或等发展
- 工作能力建设:开源贡献+技术博客+精准连接
- 小成本实验法:云上几百元买来的分布式训练学习
如果你和我情况不同,无论职业方向还是学习路径,都可以咨询 AI 了。
结语:AI 的下半场
AI 大模型的上半场是算法的狂欢,下半场拼的是工程落地。与其在红海里卷算法,不如在蓝海里建壁垒。