@ChinaInsights314

解码2024中国AI:DeepSeek如何算法破局,智算中心隐忧与万亿市场新版图 본문

어학

解码2024中国AI:DeepSeek如何算法破局,智算中心隐忧与万亿市场新版图

EyesWideShut 2025. 9. 11. 14:56

 

 

解码2024中国AI:DeepSeek如何算法破局,智算中心隐忧与万亿市场新版图

 

[진행자]: 大家好,欢迎收睛最近这个中国的人工智能领域可以说是风起云涌特别是像DeepSeek这样的国产大模型2025年初那会儿真是引起了不小的震动感觉就是新一轮的变化就在眼前了你是不是也感受到了这股AI浪潮的冲击今天呢我们为你准备了一份特别的资料解读核心内容来自艾瑞咨询刚刚发布的2024年中国人工智能产业研究报道当然我们也会结合一些其他信息比如行业监管啊还有一些特定应用向医疗领域的补充情况咱们的任务就是帮你梳理一下这些信息 拨开AI周围的迷雾提炼出中国AI产业就是当前最重要的趋势 关键技术突破还有那些热门的应用方向 以及必须面对的挑战希望能帮你清晰地把握这个快速变化的领域 好 我们就正开始首先从宏观层面来看 这个国家战略的推动力非常强劲AI被明确定义为新一轮科技革命和产业变革的核心引擎中央还有像北京上海这些地方政府都推出了相当有力的支持政策报告还特别提到2025年2月最高领导人在一次会议上也强调了AI的战略地位还有就是民营企业在里面的重要作用
(Dàjiā hǎo, huānyíng shōujīng zuìjìn zhège zhōngguó de réngōng zhìnéng lǐngyù kěyǐ shuō shì fēngqǐyúnyǒng tèbié shì xiàng DeepSeek zhèyàng de guóchǎn dà móxíng 2025 niánchū nàhuìr zhēnshi yǐnqǐle bù xiǎo de zhèndòng gǎnjué jiùshì xīn yīlún de biànhuà jiù zài yǎnqiánle nǐ shì bùshì yě gǎnshòudàole zhè gǔ AI làngcháo de chōngjī jīntiān ne wǒmen wéi nǐ zhǔnbèile yī fèn tèbié de zīliào jiědú héxīn nèiróng láizì ài ruì zīxún gānggāng fābù de 2024 nián zhōngguó réngōng zhìnéng chǎnyè yánjiū bàodào dāngrán wǒmen yě huì jiéhé yīxiē qítā xìnxī bǐrú hángyè jiānguǎn a hái yǒu yīxiē tèdìng yìngyòng xiàng yīliáo lǐngyù de bǔchōng qíngkuàng zámen de rènwù jiùshì bāng nǐ shūlǐ yīxià zhèxiē xìnxī bōkāi AI zhōuwéi de míwù tíliàn chū zhōngguó AI chǎnyè jiùshì dāngqián zuì zhòngyào de qūshì guānjiàn jìshù túpò hái yǒu nàxiē rèmén de yìngyòng fāngxiàng yǐjí bìxū miànduì de tiǎozhàn xīwàng néng bāng nǐ qīngxī de bǎwò zhège kuàisù biànhuà de lǐngyù hǎo wǒmen jiù zhèng kāishǐ shǒuxiān cóng hóngguān céngmiàn lái kàn zhège guójiā zhànlüè de tuīdòng lì fēicháng qiángjìn AI bèi míngquè dìngyì wèi xīn yīlún kējì gémìng hé chǎnyè biàngé de héxīn yǐnqíng zhōngyāng hái yǒu xiàng běijīng shànghǎi zhèxiē dìfāng zhèngfǔ dōu tuīchūle xiāngdāng yǒulì de zhīchí zhèngcè bàogào hái tèbié tídào 2025 nián 2 yuè zuìgāo lǐngdǎo rén zài yī cì huìyì shàng yě qiángdiàole AI de zhànlüè dìwèi hái yǒu jiùshì mínyíng qǐyè zài lǐmiàn de zhòngyào zuòyòng)
여러분, 안녕하세요. 최근 중국의 인공지능 분야는 그야말로 파도처럼 세차게 일어나고 있습니다. 특히 DeepSeek 같은 중국산 대규모 언어 모델이 2025년 초에 상당한 파장을 일으켰는데, 새로운 변화가 눈앞에 다가온 듯한 느낌입니다. 여러분도 이 AI 물결의 충격을 느끼셨나요? 오늘 저희는 여러분을 위해 특별한 자료를 준비했습니다. 핵심 내용은 아이리서치(艾瑞咨询)가 방금 발표한 '2024년 중국 인공지능 산업 연구 보고서'에서 가져왔습니다. 물론, 업계 규제나 의료 분야의 특정 애플리케이션에 대한 보충 정보 등 다른 정보도 함께 다룰 것입니다. 저희의 임무는 여러분이 이 정보를 정리하고, AI 주변의 안개를 걷어내어 중국 AI 산업의 현재 가장 중요한 트렌드, 핵심 기술 돌파구, 그리고 인기 있는 응용 분야와 직면해야 할 도전 과제를 파악할 수 있도록 돕는 것입니다. 빠르게 변화하는 이 분야를 명확하게 이해하는 데 도움이 되기를 바랍니다. 자, 이제 시작하겠습니다. 먼저 거시적 관점에서 보면, 국가 전략의 추진력이 매우 강력합니다. AI는 새로운 과학 기술 혁명과 산업 변화의 핵심 엔진으로 명확하게 정의되었습니다. 중앙 정부와 베이징, 상하이 같은 지방 정부는 모두 매우 강력한 지원 정책을 내놓았습니다. 보고서는 특히 2025년 2월, 최고 지도자가 한 회의에서 AI의 전략적 지위와 민간 기업의 중요한 역할 또한 강조했다고 언급했습니다.

[패널]: 没错而且更有意思的是这种强力的政策支持它是放在一个特定的经济背景下的艾瑞报告指出虽然中国经济在疫情后是逐步恢复2024年GDP增速大概4.2磅吧但是呢CPI指出偏低这就反映出一定的经济下行压力在这样的背景下AI就被寄予厚望了普遍被看作是驱动增长提升效率甚至可能是帮助经济进一步回暖的关键力量那资本市场的嗅觉怎么样他们跟上了吗报告里说2024年战略投资和股权投资明显增多了这个股权投资事件占比达到了差不多78盘哇很高啊是的特别是在大模型相关的像语言及多模态技术以及更基础的层面比如AI芯片在基础层投资里这个芯片几乎占了一半这就说明资本对核心技术的关注度是非常非常高的那市场规模呢实际盘子有多大市场规模方面艾瑞报告估算2024年中国AI产业规模大概是2769亿人民币增速跟前几年比是有点方缓嗯大概在20.5左右为什么会放缓呢这背后的原因值得注意一方面是大模型在具体业务场景里的应用效果说实话还没完全达到预期啊很多企业还在摸索就是怎么真正产生价值另外一方面呢部署和训练成本确实还是挺高的成本是个大问题但报告对未来好像非常乐观预测说2025年开始会高速增长对非常乐观预测从2025年开始市场会重新进入高速增长期年均复合增长率预计能到32.18到2029年整体市场规模有望突破1万亿人民币1万亿这背后强劲的驱动力是什么能撑起这么大的增长嗯 报告认为主要是三股力量在汇合敌人就像我们后面要重点聊的DeepSeek这类高质量的开源模型出现了这极大的降低了技术使用的门槛激发了创新火力对吧对第二呢
(Méicuò érqiě gèng yǒuyìsi de shì zhè zhǒng qiánglì de zhèngcè zhīchí tā shì fàng zài yīgè tèdìng de jīngjì bèijǐng xià de ài ruì bàogào zhǐchū suīrán zhōngguó jīngjì zài yìqíng hòu shì zhúbù huīfù 2024 nián GDP zēngsù dàgài 4.2 bàng ba dànshì ne CPI zhǐchū piān dī zhè jiù fǎnyìng chū yīdìng de jīngjì xiàxíng yālì zài zhèyàng de bèijǐng xià AI jiù bèi jìyǔ hòuwàngle pǔbiàn bèi kàn zuò shì qūdòng zēngzhǎng tíshēng xiàolǜ shènzhì kěnéng shì bāngzhù jīngjì jìnyībù huínuǎn de guānjiàn lìliàng nà zīběn shìchǎng de xiùjué zěnme yàng tāmen gēn shàngle ma bàogào lǐ shuō 2024 nián zhànlüè tóuzī hé gǔquán tóuzī míngxiǎn zēngduōle zhège gǔquán tóuzī shìjiàn zhàn bǐ dàdàole chàbùduō 78 pán wā hěn gāo a shì de tèbié shì zài dà móxíng xiāngguān de xiàng yǔyán jí duōmòtài jìshù yǐjí gèng jīchǔ de céngmiàn bǐrú AI xīnpiàn zài jīchǔ céng tóuzī lǐ zhège xīnpiàn jīhū zhànle yī bàn zhè jiù shuōmíng zīběn duì héxīn jìshù de guānzhù dù shì fēicháng fēicháng gāo de nà shìchǎng guīmó ne shíjì pánzi yǒu duō dà shìchǎng guīmó fāngmiàn ài ruì bàogào gūsuàn 2024 nián zhōngguó AI chǎnyè guīmó dàgài shì 2769 yì rénmínbì zēngsù gēn qián jǐ nián bǐ shì yǒudiǎn fānghuǎn ēn dàgài zài 20.5 zuǒyòu wèishéme huì fànghuǎn ne zhè bèihòu de yuányīn zhídé zhùyì yī fāngmiàn shì dà móxíng zài jùtǐ yèwù chǎngjǐng lǐ de yìngyòng xiàoguǒ shuō shíhuà hái méi wánquán dádào yùqī a hěnduō qǐyè hái zài mōsuǒ jiùshì zěnme zhēnzhèng chǎnshēng jiàzhí lìngwài yī fāngmiàn ne bùshǔ hé xùnliàn chéngběn quèshí háishì tǐng gāo de chéngběn shìgè dà wèntí dàn bàogào duì wèilái hǎoxiàng fēicháng lèguān yùcè shuō 2025 nián kāishǐ huì gāosù zēngzhǎng duì fēicháng lèguān yùcè cóng 2025 nián kāishǐ shìchǎng huì chóngxīn jìnrù gāosù zēngzhǎng qī niánjūn fùhé zēngzhǎng lǜ yùjì néng dào 32.18 dào 2029 nián zhěngtǐ shìchǎng guīmó yǒuwàng túpò 1 wàn yì rénmínbì 1 wàn yì zhè bèihòu qiángjìn de qūdòng lì shì shénme néng chēngqǐ zhème dà de zēngzhǎng ēn bàogào rènwéi zhǔyào shì sān gǔ lìliàng zài huìhé dírén jiù xiàng wǒmen hòumiàn yào zhòngdiǎn liáo de DeepSeek zhè lèi gāozhìliàng de kāiyuán móxíng chūxiànle zhè jídà de jiàngdīle jìshù shǐyòng de ménkǎn jīfāle chuàngxīn huǒlì duì ba duì dì èr ne)
맞습니다. 그리고 더 흥미로운 점은 이러한 강력한 정책 지원이 특정 경제적 배경 하에 이루어졌다는 것입니다. 아이리서치 보고서는 중국 경제가 팬데믹 이후 점진적으로 회복하고 있으며, 2024년 GDP 성장률은 약 4.2%이지만, CPI(소비자물가지수)가 다소 낮아 일정한 경제 하방 압력이 존재함을 나타낸다고 지적합니다. 이러한 배경에서 AI는 성장을 주도하고 효율성을 높이며 심지어 경제 회복을 돕는 핵심 동력으로 큰 기대를 받고 있습니다. 그렇다면 자본 시장의 반응은 어떨까요? 보고서에 따르면 2024년 전략적 투자와 지분 투자가 눈에 띄게 증가했습니다. 지분 투자 사건이 거의 78%를 차지할 정도로 매우 높았습니다. 특히 대규모 언어 및 멀티모달 기술과 같은 대형 모델 관련 기술과 AI 칩과 같은 더 기본적인 기술에 집중되었습니다. 기본 계층 투자에서 칩이 거의 절반을 차지했다는 것은 자본이 핵심 기술에 매우 높은 관심을 보이고 있음을 의미합니다. 그렇다면 시장 규모는 실제 얼마나 될까요? 시장 규모 측면에서 아이리서치 보고서는 2024년 중국 AI 산업 규모가 약 2,769억 위안(RMB)에 달할 것으로 추정합니다. 성장률은 지난 몇 년에 비해 둔화되었는데, 약 20.5% 정도입니다. 왜 둔화되었을까요? 그 배후에는 주목할 만한 이유가 있습니다. 한편으로는 대규모 모델이 특정 비즈니스 시나리오에서 적용되는 효과가 아직 완전히 기대에 미치지 못했고, 많은 기업이 실제로 어떻게 가치를 창출할 수 있을지 모색 중이기 때문입니다. 다른 한편으로는 배포 및 훈련 비용이 여전히 상당히 높기 때문입니다. 비용이 큰 문제지만, 보고서는 미래에 대해 매우 낙관적입니다. 2025년부터 고속 성장이 시작될 것으로 예측하며, 연평균 복합 성장률이 32.18%에 달해 2029년에는 전체 시장 규모가 1조 위안을 돌파할 것으로 전망합니다. 1조 위안이라니, 이 막대한 성장을 뒷받침할 강력한 추진력은 무엇일까요? 보고서는 주로 세 가지 힘이 결합되고 있다고 보는데, 첫째는 우리가 나중에 중점적으로 다룰 DeepSeek와 같은 고품질의 오픈 소스 모델이 등장했다는 것입니다. 이는 기술 사용의 문턱을 크게 낮추고 혁신적인 불꽃을 지폈습니다. 그렇죠? 둘째는...

[진행자]: 明白了了解了宏观背景,我们来深入技术前沿看一看。
(Míngbáile liǎojiěle hóngguān bèijǐng, wǒmen lái shēnrù jìshù qiányán kàn yī kàn.)
알겠습니다. 거시적 배경을 이해했으니, 이제 기술의 최전선으로 들어가 살펴보겠습니다.

[패널]: 报告也回顾了AI模型架构的演进,从早期的CNN,RNN到后面那个关键的2017年Google提出的Transformer架构。这个Transformer可以说是奠定了现在所有大模型的基础了。
(Bàogào yě huígùle AI móxíng jiégòu de yǎnjìn, cóng zǎoqī de CNN, RNN dào hòumiàn nàgè guānjiàn de 2017 nián Google tíchū de Transformer jiégòu. Zhège Transformer kěyǐ shuō shì diàndìngle xiànzài suǒyǒu dà móxíng de jīchǔle.)
보고서도 AI 모델 아키텍처의 진화를 되돌아보는데, 초기 CNN, RNN부터 그 뒤의 핵심적인 2017년 구글이 제안한 트랜스포머(Transformer) 아키텍처까지 다룹니다. 이 트랜스포머는 지금의 모든 대규모 언어 모델의 기반을 다졌다고 할 수 있습니다.

[진행자]: 对,Transformer的出现绝对是个关键节点。现在行业里热议的Skilling Law规模法则就是说是不是模型越大数据越多算力越强效果就一定越好报告指出啊像OpenAI的GBD 4.5系列证明了这条路仍然是有效的尤其是在提升模型的通用能力方面但问题是投入产出比这个ROI越来越成为大家关注的焦点单纯靠大力出奇迹那个成本太高了所以重点开始从更大转向更翘了是不是这个意思可以这么理解因此呢所谓的后训练技术就变得一场重要了比如思维链优化Trade of ThoughtCOT这就像胶模型像人一样把复杂问题拆解成一步步来思考还有强化学习RL让模型通过试错获得奖励来学习而不是仅仅依赖那些标注好的数据这些技术的目标是显著提升模型的推理能力还有解决特定领域问题的能力像OpenAI的GPTO系列还有我们后面要重点讨论的DeepSeq R1都是在这个方向上的探索这里面有个很有趣的变化,是大家开始探索怎么让AI拥有更接近人类理性思考的所谓的系统二能力,而不仅仅是那种直觉反应式的系统一。
(Duì, Transformer de chūxiàn juéduì shìgè guānjiàn jiédiǎn. Xiànzài hángyè lǐ rèyì de Skilling Law guīmó fǎzé jiùshì shuō shì bùshì móxíng yuè dà shùjù yuè duō suàn lì yuè qiáng xiàoguǒ jiù yīdìng yuè hǎo bàogào zhǐchū a xiàng OpenAI de GBD 4.5 xìliè zhèngmíngle zhè tiáo lù réngrán shì yǒuxiào de yóuqí shì zài tíshēng móxíng de tōngyòng nénglì fāngmiàn dàn wèntí shì tóurù chǎnchū bǐ zhège ROI yuè lái yuè chéngwéi dàjiā guānzhù de jiāodiǎn dānchún kào dàlì chū qí jī nàgè chéngběn tài gāole suǒyǐ zhòngdiǎn kāishǐ cóng gèng dà zhuǎnxiàng gèng qiàole shì bùshì zhège yìsi kěyǐ zhème lǐjiě yīncǐ ne suǒwèi de hòu xùnliàn jìshù jiù biànde yīchǎng zhòngyàole bǐrú sīwéi liàn yōuhuà Trade of ThoughtCOT zhè jiù xiàng jiāo móxíng xiàng rén yīyàng bǎ fùzá wèntí chāijiě chéng yībù bù lái sīkǎo hái yǒu qiánghuà xuéxí RL ràng móxíng tōngguò shìcuò huòdé jiǎnglì lái xuéxí ér bùshì jǐnjǐn yīlài nàxiē biāozhù hǎo de shùjù zhèxiē jìshù de mùbiāo shì xiǎnzhù tíshēng móxíng de tuīlǐ nénglì hái yǒu jiějué tèdìng lǐngyù wèntí de nénglì xiàng OpenAI de GPTO xìliè hái yǒu wǒmen hòumiàn yào zhòngdiǎn tǎolùn de DeepSeq R1 dōu shì zài zhège fāngxiàng shàng de tànsuǒ zhè lǐmiàn yǒu gè hěn yǒuqù de biànhuà, shì dàjiā kāishǐ tànsuǒ zěnme ràng AI yǒngyǒu gèng jiējìn rénlèi lǐxìng sīkǎo de suǒwèi de xìtǒng èr nénglì, ér bùshì jǐnjǐn shì nàzhǒng zhíjué fǎnyìng shì de xìtǒng yī.)
네, 트랜스포머의 등장은 분명한 핵심 변곡점이었습니다. 현재 업계에서 뜨거운 논쟁이 되고 있는 스케일링 법칙(Scaling Law)은 모델이 클수록, 데이터가 많을수록, 연산력이 강할수록 효과가 더 좋아지는지에 대한 것입니다. 보고서는 OpenAI의 GBD 4.5 시리즈가 이 경로가 여전히 유효하다는 것을 증명했으며, 특히 모델의 범용 능력을 향상시키는 데 효과적이라고 지적합니다. 그러나 문제는 투자 대비 수익률(ROI)이 점차 모두의 관심사가 되고 있다는 것입니다. 단순히 막대한 힘으로 기적을 이루려는 비용은 너무 높습니다. 그래서 초점이 '더 크게'에서 '더 똑똑하게'로 바뀌기 시작한 것 아닙니까? 그렇게 이해할 수 있습니다. 따라서 이른바 '후속 훈련(Post-training)' 기술이 매우 중요해졌습니다. 예를 들어, COT(Chain of Thought)와 같은 사고 연쇄 최적화는 모델이 인간처럼 복잡한 문제를 단계별로 분해하여 사고하도록 합니다. 또한 강화 학습(RL)은 모델이 단순히 레이블이 지정된 데이터에 의존하는 대신 시행착오를 통해 보상을 얻으며 학습하게 합니다. 이러한 기술의 목표는 모델의 추론 능력과 특정 분야 문제를 해결하는 능력을 크게 향상시키는 것입니다. OpenAI의 GPTO 시리즈와 우리가 나중에 중점적으로 다룰 DeepSeq R1은 모두 이 방향을 탐색하고 있습니다. 여기에는 흥미로운 변화가 하나 있는데, 사람들이 AI가 단순히 직관적인 반응의 시스템 1이 아니라, 인간의 이성적인 사고에 더 가까운 이른바 시스템 2 능력을 갖게 하는 방법을 탐색하기 시작했다는 점입니다.

[진행자]: 这就自然引出了DeepSeek。
(Zhè jiù zìrán yǐnchūle DeepSeek.)
이것이 자연스럽게 DeepSeek를 이끌어냅니다.

[패널]: 报告里对他琢磨很多认为他通过算法层面的创新比如你刚才说的结构化系数注意力和混合专家系统MOE这个MOE就好比模型内部有很多专家每次只激活最相关的几个来处理任务这样就能省计算资源是的这样一来他就在达到顶尖性能的同时显著降低了训练和推理的成本确实是这样DeepSeq的突破尤其是在美国芯片出口管制的这个背景下意义就更大了它证明了通过算法和工程上的巧妙设计是可以在一定程度上以智取胜的减少对最尖端最昂贵的那种进口GPU就是图形处理这个主要是阶段性的供需错配还有就是当时大模型训练需求的增速其实是放缓了但是呢随着像DeepSeek V3和R1这类高效低成本高质量模型的开源他们正在快速催化各种AI应用的爆发所以未来的算力需求增长点会更多的来自实际应用中的推理环节就是Inference而不是训练可以预见推理需求的激增会大大提高现有计算中心的利用率你平时用到的一些AI应用是不是经常提示server防盲对对对有这种情况这恰恰就反映了应用端推理需求的火爆技术进步也需要相应的工具链来支撑对吧光有模型还不虚的确如此报告提到了几个关键的支撑要素,一是像Deep Speed这样基于主流框架,比如PyTorch的分布式AI开发工具,这么让训练超大模型变得更容易管理。
(Bàogào lǐ duì tā zhuómó hěnduō rènwéi tā tōngguò suànfǎ céngmiàn de chuàngxīn bǐrú nǐ gāngcái shuō de jiégòuhuà xìshù zhùyì lì hé hùnhé zhuānjiā xìtǒng MOE zhège MOE jiù hǎobǐ móxíng nèibù yǒu hěnduō zhuānjiā měi cì zhǐ jīhuó zuì xiāngguān de jǐ gè lái chǔlǐ rènwù zhèyàng jiù néng shěng jìsuàn zīyuán shì de zhèyàng yī lái tā jiù zài dádào dǐngjiān xìngnéng de tóngshí xiǎnzhù jiàngdīle xùnliàn hé tuīlǐ de chéngběn quèshí shì zhèyàng DeepSeq de túpò yóuqí shì zài měiguó xīnpiàn chūkǒu guǎnzhì de zhège bèijǐng xià yìyì jiù gèng dàle tā zhèngmíngle tōngguò suànfǎ hé gōngchéng shàng de qiǎomiào shèjì shì kěyǐ zài yīdìng chéngdù shàng yǐ zhì qǔshèng de jiǎnshǎo duì zuì jiānduān zuì ángguì dì nà zhǒng jìnkǒu GPU jiùshì túxíng chǔlǐ zhège zhǔyào shì jiēduàn xìng de gōngxū cuòpèi hái yǒu jiùshì dāngshí dà móxíng xùnliàn xūqiú de zēngsù qíshí shì fànghuǎnle dànshì ne suízhe xiàng DeepSeek V3 hé R1 zhè lèi gāoxiào dī chéngběn gāozhìliàng móxíng de kāiyuán tāmen zhèngzài kuàisù cuīhuà gèzhǒng AI yìngyòng de bàofā suǒyǐ wèilái de suàn lì xūqiú zēngzhǎng diǎn huì gèng duō de láizì shíjì yìngyòng zhōng de tuīlǐ huánjié jiùshì Inference ér bùshì xùnliàn kěyǐ yùjiàn tuīlǐ xūqiú de jīzēng huì dàdà tígāo xiàn yǒu jìsuàn zhōngxīn de lìyòng lǜ nǐ píngshí yòng dàole yīxiē AI yìngyòng shì bùshì jīngcháng tíshì server fángmáng duì duì duì yǒu zhè zhǒng qíngkuàng zhè qiàqià jiù fǎnyìngle yìngyòng duān tuīlǐ xūqiú de huǒbào jìshù jìnbù yě xūyào xiāngyìng de gōngjù liàn lái zhīchēng duì ba guāng yǒu móxíng hái bù xū dequèrúcǐ bàogào tídàole jǐ gè guānjiàn de zhīchēng yàosù, yī shì xiàng Deep Speed zhèyàng jīyú zhǔliú kuàngjià, bǐrú PyTorch de fēnbù shì AI kāifā gōngjù, zhème ràng xùnliàn chāodà móxíng biànde gèng róngyì guǎnlǐ.)
보고서는 DeepSeek를 많이 다루며, 알고리즘 측면의 혁신을 통해, 예를 들어 방금 말씀하신 구조화된 희소 어텐션(structured sparsity attention)과 MoE(Mixture of Experts) 시스템을 통해 계산 자원을 절약한다고 분석했습니다. 이 MoE는 모델 내부에 여러 전문가가 있어서 매번 가장 관련 있는 몇 명만 활성화하여 작업을 처리하는 것과 같습니다. 그렇습니다. 이렇게 하면 최고 수준의 성능을 달성하면서 훈련 및 추론 비용을 크게 절감할 수 있습니다. 정말 그렇습니다. DeepSeq의 돌파는 특히 미국의 칩 수출 규제라는 배경 속에서 그 의미가 더욱 큽니다. 이는 알고리즘과 엔지니어링의 교묘한 설계를 통해 어느 정도는 지혜로써 승리하고, 가장 첨단의 값비싼 수입 GPU에 대한 의존도를 줄일 수 있음을 증명했습니다. 이것은 주로 단계적인 수급 불일치 때문이며, 당시 대규모 모델 훈련 수요의 성장률이 실제로 둔화되기도 했습니다. 하지만 DeepSeek V3와 R1 같은 고효율, 저비용, 고품질 모델의 오픈 소스화에 따라, 이들은 다양한 AI 애플리케이션의 폭발적인 성장을 빠르게 촉진하고 있습니다. 따라서 미래의 연산력 수요 성장 동력은 훈련(Training)이 아닌 실제 애플리케이션에서의 추론(Inference) 단계에서 더 많이 나올 것입니다. 추론 수요의 급증은 기존 계산 센터의 활용도를 크게 높일 것으로 예상됩니다. 평소에 사용하는 AI 애플리케이션에서 '서버가 바쁘다'는 메시지를 자주 보셨나요? 맞습니다, 그런 경우가 있죠. 이는 바로 애플리케이션 단의 추론 수요가 얼마나 뜨거운지를 반영하는 것입니다. 기술 발전에는 그에 상응하는 도구 체인도 필요합니다. 모델만으로는 부족합니다. 맞습니다. 보고서는 몇 가지 중요한 지원 요소를 언급했습니다. 첫째는 PyTorch와 같은 주류 프레임워크를 기반으로 하는 Deep Speed와 같은 분산 AI 개발 도구입니다. 이를 통해 초대형 모델 훈련을 더 쉽게 관리할 수 있습니다.

[진행자]: 二是LLMOPS平台,也就是大模型的运维管理平台,帮助企业更高效率地去部署模拟和迭代模型。
(Èr shì LLMOPS píngtái, yě jiùshì dà móxíng de yùnwéi guǎnlǐ píngtái, bāngzhù qǐyè gèng gāoxiàolǜ dì qù bùshǔ mónǐ hé diédài móxíng.)
둘째는 LLMOps 플랫폼, 즉 대규모 모델 운영 및 관리 플랫폼으로, 기업이 모델을 더 효율적으로 배포, 시뮬레이션 및 반복하도록 돕습니다.

[패널]: 三是软银业一体机特别是对于像DeepSeek这样适合本地化部署成本可控又能定制的模型它们精准满足了像政府金融医疗工业制造这些对数据安全要求极高的B端行业的需求预计这类软硬一体的解决方案会在2025年迎来一波市场热潮好 技术铺垫好了 我们来看看应用层面的情况报告形容2024年的市场简直是战国时代 竞争异常激烈非常形象 一方面是大厂带头掀起价格战像字节 阿里 百度在去年5月纷纷大幅下调大模型API就是应用程序接口的价格有的降幅甚至超过90甚至直接免费了哇这么狠嗯这背后既有技术进步带来的成本下降比如说AI芯片优化MOE架构降低了推理成本也有抢占市场份额培育开发者生态还有积累用户数据的战略考量那另一方面呢除了价格战另一方面面向C端的产品比如AI聊天AI搜索这类应用则是在疯狂地烧钱买流量报告援引数据说像Kimi豆包这类应用在去年10月份的广告支出就可能超过了3亿人民币三个亿一个月对这种白热化竞争本质上就是在争夺AI时代的入口和用户心智商业模式上目前主流还是两种一是面向政府G端和大型企业B端的项目制提供定制化解决方案二是面向B端和C端的订阅制SaaS模式比如WPS会员的AI功能各种AI工具的付费版那报告有没有提到一些更有新意的商业模式探索有比如按效果付费模式这个听起来很吸引人对吧嗯听起来不错但是这对AI产品的实际价值交付能力还有供应商的现金流都是巨大的考验另外在西端除了订阅也出现了更灵活的按功能点或者按使用次数收费比如一些AI图像生成工具反正商业模式还在快速探索和迭代中那我们具体看看AI都用在晚些地方了报告梳理了几个重点方向首先是语言与多模态这是当前投楼资最热应用也最活跃的领域典型的应用包括AI搜索问答比如密塔AIKimi他们想提供更直接更整合的答案AI情绪陪伴,像心野,窝窝,满足用户的情感需求。
(Sān shì ruǎnyín yè yītǐ jī tèbié shì duìyú xiàng DeepSeek zhèyàng shìhé běndì huà bùshǔ chéngběn kěkòng yòu néng dìngzhì de móxíng tāmen jīngzhǔn mǎnzúle xiàng zhèngfǔ jīnróng yīliáo gōngyè zhìzào zhèxiē duì shùjù ānquán yāoqiú jí gāo de B duān hángyè de xūqiú yùjì zhè lèi ruǎnyìng yītǐ de jiějué fāng'àn huì zài 2025 nián yínglái yī bō shìchǎng rècháo hǎo jìshù pūdiàn hǎole wǒmen lái kàn kàn yìngyòng céngmiàn de qíngkuàng bàogào xíngróng 2024 nián de shìchǎng jiǎnzhí shì zhànguó shídài jìngzhēng yìcháng jīliè fēicháng xíngxiàng yī fāngmiàn shì dàchǎng dàitóu xiānqǐ jiàgé zhàn xiàng zìjié ā lǐ bǎidù zài qùnián 5 yuè fēnfēn dàfú xiàdiào dà móxíng API jiùshì yìngyòng chéngxù jiēkǒu de jiàgé yǒu de jiàngfú shènzhì chāoguò 90 shènzhì zhíjiē miǎnfèile wā zhème hěn ēn zhè bèihòu jì yǒu jìshù jìnbù dàilái de chéngběn xiàjiàng bǐrú shuō AI xīnpiàn yōuhuà MOE jiégòu jiàngdīle tuīlǐ chéngběn yěyǒu qiǎngzhàn shìchǎng fèn'é péiyù kāifāzhě shēngtài hái yǒu jīlěi yònghù shùjù de zhànlüè kǎoliàng nà lìng yī fāngmiàn ne chúle jiàgé zhàn lìng yī fāngmiàn miànxiàng C duān de chǎnpǐn bǐrú AI liáotiān AI sōusuǒ zhè lèi yìngyòng zé shì zài fēngkuáng de shāoxián mǎi liúliàng bàogào yǐnyòng shùjù shuō xiàng Kimi dòubāo zhè lèi yìngyòng zài qùnián 10 yuèfèn de guǎnggào zhīchū jiù kěnéng chāoguòle 3 yì rénmínbì sān gè yì yī gè yuè duì zhè zhǒng báirèhuà jìngzhēng běnzhì shàng jiùshì zài zhēngduó AI shídài de rùkǒu hé yònghù xīzhì shāngyè móshì shàng mùqián zhǔliú háishì liǎng zhǒng yī shì miànxiàng zhèngfǔ G duān hé dàxíng qǐyè B duān de xiàngmù zhì tígōng dìngzhì huà jiějué fāng'àn èr shì miànxiàng B duān hé C duān de dìngyuè zhì SaaS móshì bǐrú WPS huìyuán de AI gōngnéng gè zhǒng AI gōngjù de fèifù bǎn nà bàogào yǒu méiyǒu tídào yīxiē gèng yǒu xīnyì de shāngyè móshì tànsuǒ yǒu bǐrú àn xiàoguǒ fùfèi móshì zhège tīng qǐlái hěn xīyǐn rén duì ba ēn tīng qǐlái bùcuò dànshì zhè duì AI chǎnpǐn de shíjì jiàzhí jiāofù nénglì hái yǒu gōngyìngshāng de xiànjīn liú dōu shì jùdà de kǎoyàn lìngwài zài xī duān chúle dìngyuè yě chūxiànle gèng línghuó de àn gōngnéng diǎn huòzhě àn shǐyòng cìshù shōufèi bǐrú yīxiē AI túxiàng shēngchéng gōngjù fǎnzhèng shāngyè móshì háizài kuàisù tànsuǒ hé diédài zhōng nà wǒmen jùtǐ kàn kàn AI dōu yòng zài wǎn xiē dìfāngle bàogào shūlǐle jǐ gè zhòngdiǎn fāngxiàng shǒuxiān shì yǔyán yǔ duō mó tài zhè shì dāngqián tóu lóu zī zuì rè yìngyòng yě zuì huóyuè de lǐngyù diǎnxíng de yìngyòng bāokuò AI sōusuǒ wèndá bǐrú mìtǎ AI Kimi tāmen xiǎng tígōng gèng zhíjiē gèng zhěnghé de dá'àn AI qíngxù péibàn, xiàng xīn yě, wō wō, mǎnzú yònghù de qínggǎn xūqiú.)
셋째는 하드웨어와 소프트웨어 통합 장비입니다. 특히 DeepSeek와 같이 로컬 배포에 적합하고 비용을 통제할 수 있으며 맞춤 제작이 가능한 모델은 정부, 금융, 의료, 산업 제조와 같이 데이터 보안에 대한 요구가 매우 높은 B2B 산업의 수요를 정확하게 충족시킵니다. 이러한 하드웨어와 소프트웨어 통합 솔루션은 2025년에 시장에서 큰 인기를 끌 것으로 예상됩니다. 좋습니다. 기술적 기반이 잘 마련되었으니 이제 응용 분야의 상황을 살펴보겠습니다. 보고서는 2024년 시장을 전국 시대(战国时代)로 비유하며 경쟁이 매우 치열하다고 묘사합니다. 매우 적절한 비유입니다. 한편으로는 대기업들이 앞장서서 가격 전쟁을 벌였습니다. ByteDance, Alibaba, Baidu는 작년 5월에 대규모 모델 API(애플리케이션 인터페이스) 가격을 대폭 인하했으며, 일부는 90% 이상 인하하거나 심지어 무료로 제공했습니다. 와, 정말 가혹하군요. 음, 그 배후에는 AI 칩 최적화나 MoE 아키텍처가 추론 비용을 낮추는 등 기술 발전으로 인한 비용 절감도 있었지만, 시장 점유율 확보, 개발자 생태계 육성, 사용자 데이터 축적이라는 전략적 고려도 있었습니다. 다른 한편으로는 가격 경쟁 외에 AI 채팅, AI 검색과 같은 소비자(C) 대상 제품이 트래픽을 얻기 위해 엄청난 돈을 쏟아부었습니다. 보고서는 Kimi, Doubao 같은 애플리케이션이 작년 10월에 광고비로 3억 위안 이상을 지출했을 수 있다고 인용합니다. 한 달에 3억 위안이요? 맞습니다. 이런 백열 경쟁은 본질적으로 AI 시대의 진입로와 사용자 마음을 차지하기 위한 싸움입니다. 현재의 주류 비즈니스 모델은 두 가지입니다. 하나는 정부(G)와 대기업(B)을 대상으로 맞춤형 솔루션을 제공하는 프로젝트 기반 모델이고, 다른 하나는 B2B 및 B2C를 대상으로 한 SaaS(서비스형 소프트웨어) 구독 모델입니다. 예를 들어 WPS 회원에게 제공되는 AI 기능이나 다양한 AI 도구의 유료 버전이 있습니다. 보고서에 더 참신한 비즈니스 모델에 대한 탐색도 언급되어 있나요? 네, 예를 들어 성과 기반 지불 모델이 있습니다. 매력적으로 들리죠? 음, 좋게 들리지만, 이는 AI 제품의 실제 가치 제공 능력과 공급업체의 현금 흐름에 엄청난 시험대입니다. 또한 C2C 분야에서는 구독 외에도 AI 이미지 생성 도구처럼 기능 단위 또는 사용 횟수에 따라 요금을 부과하는 더 유연한 모델이 등장했습니다. 어쨌든 비즈니스 모델은 여전히 빠르게 탐색되고 반복되고 있습니다. 그렇다면 AI가 구체적으로 어디에 사용되고 있는지 살펴보겠습니다. 보고서는 몇 가지 핵심 분야를 정리했습니다. 첫째는 언어 및 멀티모달입니다. 이는 현재 투자와 응용이 가장 활발한 분야입니다. 대표적인 응용 사례로는 Meta AI, Kimi와 같은 AI 검색 및 질문/답변 서비스로, 더 직접적이고 통합된 답변을 제공하고자 합니다. 또 Xinye, Wowo와 같은 AI 감성 동반자는 사용자의 정서적 요구를 충족시킵니다. Tongyi Lingma와 같은 AI 프로그래밍 비서는 개발자의 효율성을 높입니다. 그리고 다양한 기업 또는 개인용 스마트 비서, Honor You와 같은 휴대폰 내장형 스마트 에이전트, Zhipu AutoGLM과 같이 작업을 수행할 수 있는 에이전트 등이 있습니다. 이러한 애플리케이션은 주로 대규모 언어 모델(LLM)과 멀티모달 대규모 언어 모델(MLM)에 의해 구동됩니다. Doubao는 텍스트, 음성, 이미지 입력을 동시에 처리할 수 있습니다. 시각 분야에서는 이미지와 비디오 처리도 항상 AI의 중요한 전장이었습니다.

[패널]: 没错视觉AI主要有两大块进展一是图像视频分析理解这块相对成熟像商堂海康威视这些公司在这方面有深厚积累广泛用在安防监控、工业指见这些场景。技术上,Vision Transformer 就是VIT 架构的引入,让模型能更好的理解和泛化处理复杂的视觉信息。
(Méicuò shìjué AI zhǔyào yǒu liǎng dàkuài jìnzhǎn yī shì túxiàng shìpín fēnxī lǐjiě zhè kuài xiāngduì chéngshú xiàng shāng táng hǎikāngwēishì zhèxiē gōngsī zài zhè fāngmiàn yǒu shēn hòu jīlěi guǎngfàn yòng zài ānfáng jiānkòng, gōngyè zhǐ jiàn zhèxiē chǎngjǐng. Jìshù shàng, Vision Transformer jiùshì VIT jiégòu de yǐnrù, ràng móxíng néng gèng hǎo de lǐjiě hé fànhuà chǔlǐ fùzá de shìjué xìnxī.)
맞습니다. 시각 AI는 주로 두 가지 큰 진전이 있습니다. 첫째는 이미지 및 비디오 분석 및 이해입니다. 이 분야는 비교적 성숙하며, SenseTime, Hikvision 같은 회사들이 이 분야에서 깊은 경험을 쌓았고 보안 감시, 산업 검사 등 다양한 시나리오에 널리 사용됩니다. 기술적으로는 VIT(Vision Transformer) 아키텍처의 도입으로 모델이 복잡한 시각 정보를 더 잘 이해하고 일반화하여 처리할 수 있게 되었습니다.

[진행자]: 二是图像视频生成编辑,这是AIGC 浪朝下的新热点。国内像剪映的AI 功能、美图秀秀,还有快手的可灵AI都在这个方向发力。技术上,Diffusion Transformer DIT架构是目前的主流OpenAI的Soro模型进一步验证了这条路线的巨大潜力语音交互和生成方面有什么新动向?语音技术也在持续进化应用包括AI语音交互比如各种智能音箱、
(Èr shì túxiàng shìpín shēngchéng biānjí, zhè shì AIGC làng cháo xià de xīn rèdiǎn. Guónèi xiàng jiǎn yìng de AI gōngnéng, měi tú xiù xiù, hái yǒu kuàishǒu de kě líng AI dōu zài zhège fāngxiàng fālì. Jìshù shàng, Diffusion Transformer DIT jiégòu shì mùqián de zhǔliú OpenAI de Soro móxíng jìnyībù yànzhèngle zhè tiáo lùxiàn de jùdà qiánlì yǔyīn jiāohù hé shēngchéng fāngmiàn yǒu shé me xīn dòngxiàng? Yǔyīn jìshù yě zài chíxù jìnhuà yìngyòng bāokuò AI yǔyīn jiāohù bǐrú gè zhǒng zhìnéng yīnxiāng,)
둘째는 이미지 및 비디오 생성과 편집입니다. 이는 AIGC(AI Generated Content) 물결 아래 새로운 핫스팟입니다. 중국에서는 Jianying의 AI 기능, Meitu Xiuxiu, 그리고 Kuaishou의 Keling AI가 모두 이 방향에 힘을 쏟고 있습니다. 기술적으로는 디퓨전 트랜스포머(DiT) 아키텍처가 현재 주류이며, OpenAI의 Sora 모델은 이 경로의 거대한 잠재력을 더욱 입증했습니다. 음성 상호작용 및 생성 분야에는 어떤 새로운 동향이 있습니까? 음성 기술도 계속 진화하고 있습니다. 적용 사례로는 다양한 스마트 스피커와 같은 AI 음성 상호작용,

[패널]: 车载助手的对话能力AI语音科隆与生成比如模音工坊可以生成非常逼真的AI配音以及AI音乐创作像国外的SUNO国内字节跳动的海绵音乐技术趋势是探索端到端的语音模型目标是减少处理廉时让语音交互更自然更流畅科大讯飞的星火语音大模型就是这个方向的代表还有一个很火的概念是AI agent智能体这似乎是未来的一个重要方向对AI agent被寄予厚望像质朴的auto GLM蝴蝶效应的menus都在探索这个方向Agent的核心思想是让AI不仅仅能对话更能理解复杂指令自主规划步骤调用工具最终完成实际任务它们被看作是连接大模型通用智能和现实世界具体行动的桥梁潜力巨大但目前挑战也不小比如产品形态还比较同质化实际能力还要再提升多个agent怎么协同工作等等这些问题都还在探索中最后AI硬件也是一个明显的趣事是的,AI硬件正在加速普及,AI手机,华为,小米这些都在补局,AI PC,个人电脑,AI学习机像科大训飞的,AI耳机,字介的那个Olafrand等等,AI能力正被深度集成到我们日常使用的终端设备里。
(Chēzài zhùshǒu de duìhuà nénglì AI yǔyīn kēlóng yǔ shēngchéng bǐrú mó yīn gōngfāng kěyǐ shēngchéng fēicháng bīzhēn de AI pèiyīn yǐjí AI yīnyuè chuàngzuò xiàng guówài de SUNO guónèi zìjié tiàodòng de hǎimián yīnyuè jìshù qūshì shì tànsuǒ duān dào duān de yǔyīn móxíng mùbiāo shì jiǎnshǎo chǔlǐ lián shí ràng yǔyīn jiāohù gèng zìrán gèng liúchàng kē dà xùnfēi de xīnghuǒ yǔyīn dà móxíng jiùshì zhège fāngxiàng de dàibiǎo hái yǒu yīgè hěn huǒ de gàiniàn shì AI agent zhìnéng tǐ zhè sìhū shì wèilái de yīgè zhòngyào fāngxiàng duì AI agent bèi jìyǔ hòuwàng xiàng zhìpǔ de auto GLM húdié xiàoyì de menus dōu zài tànsuō zhège fāngxiàng Agent de héxīn sīxiǎng shì ràng AI bù jǐnjǐn néng duìhuà gèng néng lǐjiě fùzá zhǐlìng zìzhǔ guīhuà bùzhòu diàoyòng gōngjù zuìzhōng wánchéng shíjì rènwù tāmen bèi kàn zuò shì liánjiē dà móxíng tōngyòng zhìnéng hé xiànshí shìjiè jùtǐ xíngdòng de qiáoliáng qiánlì jùdà dàn mùqián tiǎozhàn yě bù xiǎo bǐrú chǎnpǐn xíngtài hái bǐjiào tóngzhìhuà shíjì nénglì hái yào zài tíshēng duō gè agent zěnme xié tóng gōngzuò děngděng zhèxiē wèntí dōu háizài tànsuǒ zhōng zuìhòu AI yìngjiàn yěshì yīgè míngxiǎn de qùshì shì de, AI yìngjiàn zhèngzài jiāsù pǔjí, AI shǒujī, huáwèi, xiǎomǐ zhèxiē dōu zài bǔ jú, AI PC, gèrén diànnǎo, AI xuéxí jī xiàng kē dà xùn fēi de, AI ěrjī, zì jiè de nàgè Olafrand děngděng, AI nénglì zhèng bèi shēndù jíchéng dào wǒmen rìcháng shǐyòng de zhōngduān shèbèi lǐ.)
차량용 비서의 대화 능력, Mo Yin Gongfang과 같은 AI 음성 클론 및 생성으로 매우 사실적인 AI 더빙을 생성하고, 해외의 SUNO, 중국 ByteDance의 Haimian Music과 같은 AI 음악 창작이 있습니다. 기술적 트렌드는 엔드투엔드(end-to-end) 음성 모델을 탐색하여 처리 지연 시간을 줄이고 음성 상호작용을 더 자연스럽고 유연하게 만드는 것을 목표로 합니다. iFlytek의 Xinghuo 음성 대규모 언어 모델이 이 분야의 대표적인 예입니다. 또 매우 뜨거운 개념은 AI 에이전트(Agent) 또는 스마트 에이전트입니다. 이는 미래의 중요한 방향인 것 같습니다. 네, AI 에이전트는 큰 기대를 받고 있으며, Zhipu의 AutoGLM, Butterfly Effect의 Menus 등이 이 방향을 탐색하고 있습니다. 에이전트의 핵심 아이디어는 AI가 단순히 대화만 하는 것이 아니라, 복잡한 지시를 이해하고, 스스로 단계를 계획하고, 도구를 호출하여 실제 작업을 최종적으로 완료하도록 하는 것입니다. 이들은 대규모 모델의 범용 지능과 현실 세계의 구체적인 행동을 연결하는 다리로 여겨지며, 잠재력이 매우 큽니다. 그러나 현재 도전 과제도 만만치 않습니다. 예를 들어, 제품 형태가 비교적 동질적이고 실제 능력이 더 향상되어야 하며, 여러 에이전트가 어떻게 협력하는지 등 이 모든 문제가 여전히 탐색 단계에 있습니다. 마지막으로, AI 하드웨어도 명확한 트렌드입니다. 네, AI 하드웨어는 빠르게 보급되고 있습니다. AI 휴대폰(Huawei, Xiaomi 등), AI PC(개인용 컴퓨터), iFlytek의 AI 학습기, ByteDance의 Olafrand와 같은 AI 이어폰 등 AI 기능이 우리가 일상적으로 사용하는 최종 기기에 깊이 통합되고 있습니다.

[진행자]: 端侧大模型的部署让这些设备不需要时刻联网也能提供更智能更个性化的服务体验国内市场竞争这么激烈报告也提到了出海的机会和挑战是吧确实对于一些中国AI企业来说,海外市场提供了更广阔的空间,可能还有更好的用户付费习惯,以及在某些细分领域竞争环境相对缓和一些。
(Duān cè dà móxíng de bùshǔ ràng zhèxiē shèbèi bù xūyào shíkè liánwǎng yě néng tígōng gèng zhìnéng gèng gèxìng huà de fúwù tǐyàn guónèi shìchǎng jìngzhēng zhème jīliè bàogào yě tídàole chū hǎi de jīhuì hé tiǎozhàn shì ba quèshí duìyú yīxiē zhōngguó AI qǐyè lái shuō, hǎiwài shìchǎng tígōngle gèng guǎngkuò de kōngjiān, kěnéng hái yǒu gèng hǎo de yònghù fùfèi xíguàn, yǐjí zài mǒu xiē xìfēn lǐngyù jìngzhēng huánjìng xiāngduì huǎnhé yīxiē.)
클라이언트 측 대규모 모델의 배포로 인해 이러한 장치는 항상 인터넷에 연결되어 있지 않아도 더 똑똑하고 개인화된 서비스 경험을 제공할 수 있게 되었습니다. 중국 내 시장 경쟁이 이렇게 치열하니, 보고서도 해외 진출의 기회와 도전 과제를 언급했죠? 맞습니다. 일부 중국 AI 기업에게 해외 시장은 더 넓은 공간을 제공하며, 더 나은 사용자 결제 습관과 특정 세분화된 분야에서 상대적으로 덜 치열한 경쟁 환경을 제공할 수 있습니다.

[패널]: 出海的产品类型主要集中在工具类应用,比如图像视频编辑、效率工具、还有情感陪伴类等等。
(Chūhǎi de chǎnpǐn lèixíng zhǔyào jízhōng zài gōngjù lèi yìngyòng, bǐrú túxiàng shìpín biānjí, xiàolǜ gōngjù, hái yǒu qínggǎn péibàn lèi děngděng.)
해외 진출하는 제품 유형은 주로 이미지 및 비디오 편집, 생산성 도구, 감성 동반자 등과 같은 도구형 애플리케이션에 집중되어 있습니다.

[진행자]: 但挑战肯定也不小。
(Dàn tiǎozhàn kěndìng yě bù xiǎo.)
하지만 도전 과제도 분명히 만만치 않겠죠.

[패널]: 对,挑战同样巨大。文化和用户习惯的差异,数据跨境传输的隐私和合规问题,不同国家和地区的监管政策,比如知识权,产,内容审核这些,都是出海企业必须跨过的门槛。好了,我们现在必须聚焦讨论一下DeepSeq了,报告花了大量篇幅分析它,显然认为它是一个关键变量。
(Duì, tiǎozhàn tóngyàng jùdà. Wénhuà hé yònghù xíguàn de chāyì, shùjù kuàjìng chuánshū de yǐnsī hé héguī wèntí, bùtóng guójiā hé dìqū de jiānguǎn zhèngcè, bǐrú zhīshì quán, chǎn, nèiróng shěnhé zhèxiē, dōu shì chūhǎi qǐyè bìxū kuàguò de ménkǎn. Hǎole, wǒmen xiànzài bìxū jùjiāo tǎolùn yīxià DeepSeqle, bàogào huāle dàliàng piānfú fēnxī tā, xiǎnrán rènwéi tā shì yīgè guānjiàn biànliàng.)
네, 도전 과제 또한 엄청납니다. 문화와 사용자 습관의 차이, 데이터 국경 간 전송의 개인 정보 보호 및 규정 준수 문제, 지적 재산권, 콘텐츠 검토 등 다른 국가 및 지역의 규제 정책은 모두 해외 진출 기업이 반드시 넘어야 할 문턱입니다. 자, 이제 DeepSeq에 집중하여 논의해야 합니다. 보고서는 많은 지면을 할애하여 이를 분석하고 있으며, 분명히 핵심적인 변수라고 생각합니다.

[진행자]: 它到底特殊在哪里DeepSeek之所以这么重要在于它同时实现了开源共享和关键创新突破它从2023年7月才成立,时间很短,但在短时间内就发布了性能顶尖的V3通用模型化R1推理模型,而且它的APP在2025年初实现了用户量的爆炸式生长,非常惊人。
(Tā dàodǐ tèshū zài nǎlǐ DeepSeek zhī suǒyǐ zhème zhòngyào zàiyú tā tóngshí shíxiànle kāiyuán gòngxiǎng hé guānjiàn chuàngxīn túpò tā cóng 2023 nián 7 yuè cái chénglì, shíjiān hěn duǎn, dàn zài duǎn shíjiān nèi jiù fābùle xìngnéng dǐngjiān de V3 tōngyòng móxíng huà R1 tuīlǐ móxíng, érqiě tā de APP zài 2025 niánchū shíxiànle yònghù liàng de bàozhà shì shēngzhǎng, fēicháng jīngrén.)
도대체 무엇이 특별한가요? DeepSeek가 이렇게 중요한 이유는 오픈 소스 공유와 핵심 혁신 돌파를 동시에 달성했기 때문입니다. 2023년 7월에야 설립되어 역사는 매우 짧지만, 짧은 시간 안에 최고 성능의 V3 범용 모델과 R1 추론 모델을 출시했으며, 2025년 초에는 앱 사용자가 폭발적으로 증가하여 매우 놀라웠습니다.

[패널]: 那它的核心价值是什么?仅仅是性能好吗?还是说,开放了模型权重,还公布了详细的技术报告,训练细节,甚至部分关键代码。
(Nà tā de héxīn jiàzhí shì shénme? Jǐnjǐn shì xìngnéng hǎo ma? Háishì shuō, kāifàngle móxíng quánzhòng, hái gōngbùle xiángxì de jìshù bàogào, xùnliàn xìjié, shènzhì bùfèn guānjiàn dàimǎ.)
그렇다면 그 핵심 가치는 무엇입니까? 단순히 성능이 좋다는 것입니까? 아니면 모델 가중치를 공개하고 상세한 기술 보고서, 훈련 세부 정보, 심지어 일부 핵심 코드까지 공개했다는 것입니까?

[진행자]: 这就极大的推动了整个AI社区的进步降低了其他研究者和开发者在它技术上进行创新的门槛形成了一个开放的生态开放确实很重要而在创新突破方面V3模型通过我们前面提到的MOE这些工程优化手段实现了少花钱多办事在保证高性能的同时大幅降低了成本更具颠覆性的是RIE模型它大胆探索了纯粹基于强化学习的后训练路径比如采用了一种叫做GRPO组相对策略优化的技术依靠简单的做得好就奖励做不好就调整这种机制在几乎不需要人工精细标注数据的情况下显著提升了模型的推理和遵循指令的能力这在某种程度上是跳过了传统那种依赖大量宣读微调数据的流程这个RE模型听起来很不一样这背后揭示了什么更深层次的意义吗嗯 这揭示了AI技术发展的范式可能正在发生转变DeepSleep用实践证明了用算法和创新换算力这条路是走得通的它挑战了过去那种主要依靠堆算力依赖海量人工标注数据的笨办法它为我们思考如何实现通用人工智能AGR提供了新的视角比如强化学习和高质量的合成数据可能扮演着比我们想象中更重要的角色那么DeepSeek对整个中国AI产业的具体影响体现在哪些方面呢影响是多维度的第一技术普惠高性能低成本的开源模型让中小企业和开发者也能用上最先进的AI技术极大的激发了整个生态的创新活力嗯降低门槛第二,应用加速它有力地推动了大模型在各类场景的落地尤其是在那些对成本和数据安全敏感需要本地化部署的B端行业像政府、
(Zhè jiù jídà de tuīdòngle zhěnggè AI shèqū de jìnbù jiàngdīle qítā yánjiū zhě hé kāifāzhě zài tā jìshù shàng jìnxíng chuàngxīn de ménkǎn xíngchéngle yīgè kāifàng de shēngtài kāifàng quèshí hěn zhòngyào ér zài chuàngxīn túpò fāngmiàn V3 móxíng tōngguò wǒmen qiánmiàn tídào de MOE zhèxiē gōngchéng yōuhuà shǒuduàn shíxiànle shǎo huā qián duō bànshì zài bǎozhèng gāo xìngnéng de tóngshí dàfú jiàngdīle chéngběn gèng jù diānfùxìng de shì RIE móxíng tā dàdǎn tànsuǒle chúncuì jīyú qiánghuà xuéxí de hòu xùnliàn lùjìng bǐrú cǎiyòngle yī zhǒng jiàozuò GRPO zǔ xiāngduì cèlüè yōuhuà de jìshù yīkào jiǎndān de zuò dé hǎo jiù jiǎnglì zuò bù hǎo jiù tiáozhěng zhè zhǒng jīzhì zài jīhū bù xūyào réngōng jīngxì biāozhù shùjù de qíngkuàng xià xiǎnzhù tíshēngle móxíng de tuīlǐ hé zūnxún zhǐlìng de nénglì zhè zài mǒuzhǒng chéngdù shàng shì tiàoguòle chuántǒng nà zhǒng yīlài dàliàng xuāndú wéitiáo shùjù de liúchéng zhège RE móxíng tīng qǐlái hěn bù yīyàng zhè bèihòu jiēshìle shénme gèng shēncì de yìyì ma ēn zhè jiēshìle AI jìshù fāzhǎn de fànshì kěnéng zhèngzài fāshēng zhuǎnbiàn DeepSleep yòng shíjiàn zhèngmíngle yòng suànfǎ hé chuàngxīn huàn suàn lì zhè tiáo lù shì zǒu détōng de tā tiǎozhànle guòqù nà zhǒng zhǔyào yīkào duī suàn lì yīlài hǎiliàng réngōng biāozhù shùjù de bèn bànfǎ tā wèi wǒmen sīkǎo rúhé shíxiàn tōngyòng réngōng zhìnéng AGR tígōngle xīn de shìjiǎo bǐrú qiánghuà xuéxí hé gāozhìliàng de héchéng shùjù kěnéng bànyǎnzhe bǐ wǒmen xiǎngxiàng zhōng gèng zhòngyào de juésè nàme DeepSeek duì zhěnggè zhōngguó AI chǎnyè de jùtǐ yǐngxiǎng tǐxiàn zài nǎxiē fāngmiàn ne yǐngxiǎng shì duō wéi dù de dì yī jìshù pǔhuì gāo xìngnéng dī chéngběn de kāiyuán móxíng ràng zhōngxiǎo qǐyè hé kāifāzhě yě néng yòng shàng zuì xiānjìn de AI jìshù jídà de jīfāle zhěnggè shēngtài de chuàngxīn huólì ēn jiàngdī ménkǎn dì èr, yìngyòng jiāsù tā yǒulì de tuīdòngle dà móxíng zài gèlèi chǎngjǐng de luòdì yóuqí shì zài nàxiē duì chéngběn hé shùjù ānquán mǐngǎn xūyào běndì huà bùshǔ de B duān hángyè xiàng zhèngfǔ,)
이는 전체 AI 커뮤니티의 발전을 크게 촉진하고 다른 연구자와 개발자가 DeepSeek의 기술을 기반으로 혁신할 수 있는 문턱을 낮추며 개방형 생태계를 형성했습니다. 개방은 정말 중요합니다. 그리고 혁신적인 돌파구 측면에서, V3 모델은 앞서 언급한 MoE와 같은 엔지니어링 최적화 수단을 통해 '적은 비용으로 더 많은 일을 하는' 것을 달성했습니다. 고성능을 보장하면서 비용을 크게 절감했습니다. 더 파괴적인 것은 R1E 모델인데, 이는 순전히 강화 학습 기반의 후속 훈련 경로를 과감하게 탐색했습니다. 예를 들어, GRPO(Group-Relative Policy Optimization)라는 기술을 사용하여 '잘하면 보상하고, 못하면 조정하는' 단순한 메커니즘에 의존합니다. 이는 거의 수작업으로 정밀하게 레이블을 지정한 데이터가 필요 없는 상황에서 모델의 추론 능력과 지시를 따르는 능력을 크게 향상시켰습니다. 이는 어떤 면에서는 대량의 미세 조정 데이터에 의존하는 기존의 과정을 건너뛴 것입니다. 이 R1E 모델은 매우 다르게 들립니다. 그 이면에는 어떤 더 깊은 의미가 있습니까? 음, 이는 AI 기술 발전의 패러다임이 변화하고 있음을 보여줍니다. DeepSleep은 알고리즘과 혁신으로 연산력을 대체하는 이 경로가 실현 가능하다는 것을 실천으로 증명했습니다. 이는 과거에 주로 연산력을 쌓고 대량의 수작업으로 레이블을 지정한 데이터에 의존하는 어리석은 방법을 거부합니다. 이는 강화 학습과 고품질 합성 데이터가 우리가 생각했던 것보다 더 중요한 역할을 할 수 있다는 새로운 관점을 제공하며, 범용 인공 지능(AGI)을 달성하는 방법에 대해 생각하게 합니다. 그렇다면 DeepSeek가 전체 중국 AI 산업에 미치는 구체적인 영향은 어떤 측면에서 나타납니까? 영향은 다차원적입니다. 첫째, 기술 보편화입니다. 고성능의 저비용 오픈 소스 모델은 중소기업과 개발자도 최첨단 AI 기술을 사용할 수 있게 하여 전체 생태계의 혁신 활력을 크게 고취시켰습니다. 음, 문턱을 낮췄죠. 둘째, 응용 가속화입니다. 이는 대규모 모델이 다양한 시나리오에 적용되는 것을 강력하게 추진했으며, 특히 비용과 데이터 보안에 민감하고 로컬 배포가 필요한 정부와 같은 B2B 산업에서 두드러집니다.

[진행자]: 金融、
(Jīnróng,)
금융,

[패널]: 医疗这些同时也催生了更多面向C端的AI原生应用和AI硬件的发展第三,国产替代与技术突围在当前这个国际形势下DeepSeek的成功在一定程度上缓解了对外部尖端技术的依赖增强了中国AI产业的自主性和韧性这点很重要第四还好促进了向模型征流这些相关技术的发展就是说怎么把大模型的知识有效地迁移到更小的模型上这对于在手机PC这些终端设备上部署AI至关重要明白了不过技术发展这么快风险和治理问题也变得越来越突出报告也提到随着AI深入生活公众的焦虑感好像也在上升对安全是底线这一点毫无疑问报告把风险主要分成了两类一是内生安全风险这主要来自技术本身比如训练数据可能带有的偏见导致模型输出歧视性内容模型可能一本正经的胡说八道就是幻觉问题数据隐私泄露风险还有模型可能被恶意投毒攻击等等二是应用安全风险这关系到AI在社会层面的影响比如被用来大规模制造和传播虚假信息加剧信息减防效应知识产权归属不清AI决策失误可能导致的责任问题以及更深层次的伦理困境比如用户对AI产生过度情感依赖人类的权利是否会被不当让渡等等这提出了一个核心问题就是如何确保AI的发展是向善的可控的对此监管层面有哪些动作报告提到了中国的那个生成是人工智能服务管理暂行办法对这部办法是中国在生成是AI领域的一个重要监管框架他对提供服务的企业规定了多项义务核心要求包括要确保生成内容的合法合规采取措施防止不良信息传播要尊重知识产权和个人信息权益处理数据要合法规范特别是涉及个人信息的要获得统一对于具有舆论属性或社会动员能力的服务还需要进行安全评估和算法备案看来建立一个有效的智力体系是一个复杂而且持续的过程啊确实如此无论是艾瑞的报告还是像普华永道这些机构的分析都强调需要一个动态的多方参与的治理框架就不仅是政府监管的事情还需要技术社区企业法律界伦理学者以及公众的共同参与需要政策引导也需要行业自律和国际间的协调合作同时,企业内部也必须建立起强健的AI风险管理机制,比如定期进行模型安全测试,加强员工对AI伦理和偏见的培训,甚至设立专门的AI风险官,把风险管理嵌入到产品开发和运营的全楼层中去。
(Yīliáo zhèxiē tóngshí yě cuīshēngle gèng duō miànxiàng C duān de AI yuánshēng yìngyòng hé AI yìngjiàn de fāzhǎn dì sān, guóchǎn tìdài yǔ jìshù tūwéi zài dāngqián zhège guójì xíngshì xià DeepSeek de chénggōng zài yīdìng chéngdù shàng huǎnjiěle duì wàibù jiānduān jìshù de yīlài zēngqiángle zhōngguó AI chǎnyè de zìzhǔ xìng hé rèn xìng zhè diǎn hěn zhòngyào dì sì hái hǎo cùjìnle xiàng móxíng zhēng liú zhèxiē xiāngguān jìshù de fāzhǎn jiùshì shuō zěnme bǎ dà móxíng de zhīshì yǒuxiào dì qiānyí dào gèng xiǎo de móxíng shàng zhè duìyú zài shǒujī PC zhèxiē zhōngduān shèbèi shàng bùshǔ AI zhì guān zhòngyào míngbáile bùguò jìshù fāzhǎn zhème kuài fēngxiǎn hé zhìlì wèntí yě biànde yuè lái yuè tūchū bàogào yě tídào suízhe AI shēnrù shēnghuó gōngzhòng de jiāolǜ gǎn hǎoxiàng yě zài shàngshēng duì ānquán shì dǐxiàn zhè yī diǎn háo wú yíwèn bàogào bǎ fēngxiǎn zhǔyào fēn chéngle liǎng lèi yī shì nèi shēng ānquán fēngxiǎn zhè zhǔyào láizì jìshù běnshēn bǐrú xùnliàn shùjù kěnéng dàiyǒu de piānjàn dǎozhì móxíng shūchū qíshì xìng nèiróng móxíng kěnéng yībān zhèngjīng de húshuō bādào jiùshì huànjué wèntí shùjù yǐnsī xièlòu fēngxiǎn hái yǒu móxíng kěnéng bèi èyì tóudú gōngjí děng děng èr shì yìngyòng ānquán fēngxiǎn zhè guānxì dào AI zài shèhuì céngmiàn de yǐngxiǎng bǐrú bèi yòng lái dàguīmó zhìzào hé chuánbō xūjiǎ xìnxī jiājù xìnxī jiǎnfáng xiàoyì zhīshì chǎnquán guīshǔ bùqīng AI juécè shīwù kěnéng dǎozhì de zérèn wèntí yǐjí gèng shēncì de lúnlǐ kùnjìng bǐrú yònghù duì AI chǎnshēng guòdù qínggǎn yīlài rénlèi de quánlì shìfǒu huì bèi bùdāng ràng dù děngděng zhè tíchūle yīgè héxīn wèntí jiùshì rúhé quèbǎo AI de fāzhǎn shì xiàng shàn de kěkòng de duì cǐ jiānguǎn céngmiàn yǒu nǎxiē dòngzuò bàogào tídàole zhōngguó de nàgè shēng chéng shì réngōng zhìnéng fúwù guǎnlǐ zànxíng bànfǎ duì zhè bù bànfǎ shì zhōngguó zài shēng chéng shì AI lǐngyù de yīgè zhòngyào jiānguǎn kuàngjià tā duì tígōng fúwù de qǐyè guīdìngle duō xiàng yìwù héxīn yāoqiú bāokuò yào quèbǎo shēngchéng nèiróng de héfǎ héguī cǎiqǔ cuòshī fángzhǐ bùliáng xìnxī chuánbò yào zūnzhòng zhīshì chǎnquán hé gèrén xìnxī quányì chǔlǐ shùjù yào héfǎ guīfàn tèbié shì shèjí gèrén xìnxī de yào huòdé tǒngyī duìyú jùyǒu yúlùn shǔxìng huò shèhuì dòngyuán nénglì de fúwù hái xūyào jìnxíng ānquán pínggū hé suànfǎ bèién kàn qǐlái jiànlì yīgè yǒuxiào de zhìlì tǐxì shì yīgè fùzá érqiě chíxù de guòchéng a quèshí rúcǐ wúlùn shì ài ruì de bàogào háishì xiàng pǔhuá yǒng dào zhèxiē jīgòu de fēnxī dōu qiángdiào xūyào yīgè dòngtài de duōfāng cānyù de zhìlǐ kuàngjià jiù bùjǐn shì zhèngfǔ jiānguǎn de shìqíng hái xūyào jìshù shèqū qǐyè fǎlǜ jiè lúnlǐ xuézhě yǐjí gōngzhòng de gòngtóng cānyù xūyào zhèngcè yǐndǎo yě xūyào hángyè zìlǜ hé guójì jiān de xiédiáo hézuò tóngshí, qǐyè nèibù yě bìxū jiànlì qǐ qiángjiàn de AI fēngxiǎn guǎnlǐ jīzhì, bǐrú dìngqí jìnxíng móxíng ānquán cèshì, jiāqiáng yuángōng duì AI lúnlǐ hé piānjian de péixùn, shènzhì shèlì zhuānmén de AI fēngxiǎn guān, bǎ fēngxiǎn guǎnlǐ qiánrù dào chǎnpǐn kāifā hé yùnyíng de quán lóu céng zhōng qù.)
의료 분야 등입니다. 이와 동시에 더 많은 소비자 대상 AI 네이티브 애플리케이션과 AI 하드웨어의 발전도 촉진되었습니다. 셋째, 국산화 대체 및 기술 돌파입니다. 현재의 국제 정세 속에서 DeepSeek의 성공은 외부 첨단 기술에 대한 의존도를 어느 정도 완화하고 중국 AI 산업의 자율성과 회복력을 강화했다는 점에서 매우 중요합니다. 넷째는 모델 증류(distillation)와 같은 관련 기술의 발전도 촉진했다는 점입니다. 즉, 대규모 모델의 지식을 어떻게 더 작은 모델로 효과적으로 이전하는가 하는 것입니다. 이는 휴대폰, PC와 같은 최종 기기에 AI를 배포하는 데 매우 중요합니다. 알겠습니다. 하지만 기술이 이렇게 빠르게 발전하면서 위험과 거버넌스 문제도 점점 더 두드러지고 있습니다. 보고서도 AI가 생활 속으로 깊숙이 파고들면서 대중의 불안감도 커지고 있다고 언급했습니다. 안전이 최우선이라는 점은 의심할 여지가 없습니다. 보고서는 위험을 주로 두 가지 범주로 나눕니다. 첫째는 내재적 안전 위험입니다. 이는 주로 기술 자체에서 비롯됩니다. 예를 들어, 훈련 데이터에 잠재된 편향으로 인해 모델이 차별적인 내용을 출력하거나, 모델이 그럴싸하게 헛소리를 하는 환각(hallucination) 문제, 데이터 개인 정보 유출 위험, 그리고 모델이 악의적인 공격을 받을 수 있는 위험 등입니다. 둘째는 응용 안전 위험입니다. 이는 AI가 사회에 미치는 영향과 관련이 있습니다. 예를 들어, AI가 대규모로 허위 정보를 만들고 유포하는 데 사용되어 정보 방어 효과를 약화시키고, 지적 재산권 귀속이 불분명해지며, AI 의사 결정 오류로 인해 발생할 수 있는 책임 문제, 그리고 사용자가 AI에 과도한 정서적 의존성을 갖게 되거나 인간의 권리가 부적절하게 양도될 수 있는 더 깊은 윤리적 딜레마 등입니다. 이는 AI의 발전이 선하고 통제 가능하도록 어떻게 보장할 것인가라는 핵심 질문을 제기합니다. 이에 대해 규제 측면에서는 어떤 움직임이 있습니까? 보고서는 중국의 '생성형 인공지능 서비스 관리 잠정 방안'을 언급했습니다. 이 방안은 중국이 생성형 AI 분야에서 마련한 중요한 규제 프레임워크입니다. 이는 서비스를 제공하는 기업에 여러 의무를 부과합니다. 핵심 요구사항은 생성된 콘텐츠의 합법성과 규정 준수를 보장하고, 유해한 정보 확산을 방지하기 위한 조치를 취하며, 지적 재산권 및 개인 정보 권리를 존중하고, 특히 개인 정보와 관련된 데이터 처리는 합법적이고 규범적이어야 하며 동의를 얻어야 한다는 것입니다. 여론 속성을 갖거나 사회 동원 능력이 있는 서비스의 경우 안전 평가와 알고리즘 등록도 필요합니다. 효과적인 거버넌스 시스템을 구축하는 것은 복잡하고 지속적인 과정인 것 같습니다. 정말 그렇습니다. 아이리서치 보고서든 PwC와 같은 기관의 분석이든 모두 정부 규제만이 아니라 기술 커뮤니티, 기업, 법조계, 윤리학자, 그리고 대중의 공동 참여가 필요한 역동적인 다자간 거버넌스 프레임워크가 필요하다고 강조합니다. 정책적 지침과 함께 업계의 자율 규제 및 국제적 협력도 필요합니다. 동시에 기업 내부에서도 정기적인 모델 안전 테스트, AI 윤리 및 편향에 대한 직원 교육 강화, 심지어는 AI 위험 관리 담당관을 두는 등 강력한 AI 위험 관리 메커니즘을 구축하여 제품 개발 및 운영의 모든 단계에 위험 관리를 내재화해야 합니다.

[진행자]: 好了,经过精尖的探讨,我们基于艾瑞的这份报告,为你勾勒出了一幅当前中国AI产业的图景。
(Hǎole, jīngguò jīngjiān de tàntǎo, wǒmen jīyú ài ruì de zhè fèn bàogào, wéi nǐ gōulè chūle yī fú dāngqián zhōngguó AI chǎnyè de tújǐng.)
좋습니다. 심층적인 논의를 거쳐 아이리서치의 이 보고서를 바탕으로 현재 중국 AI 산업의 청사진을 그려보았습니다.

[패널]: 国家战略在强力推动以DeepSeek为代表的技术创新在加速扑破市场竞争空前激烈各种应用场景也在快速拓展的确这是一个充满活力但也充满挑战的阶段商业化的道路仍在摸索中如何平衡投入与产出如何建立可持续的商业模式如何提升用户价值和粘性这些都是非常现实的问题同时呢安全伦理和治理的挑战也伴随着技术发展日益凸显核心的难题始终在追求快速创新与确保安全公平和互伦理之间找到那个微妙而关键的平衡点这注定是一个持续探索不断调整的过程最后留给你一个值得深入思考的问题报告反复强调像DeepSeek这样的模型通过算法和工程上的创新在一定程度上降低了对纯粹算力规模的依赖依然取得了世界级的成果这对未来全球AI的竞争格局可能意味着什么尤其是在资源获取特别是尖端硬件可能面临限制的情况下巧妙的算法创新和工程优化会不会成为比庞大资源投入更具决定性的力量呢感谢收听本次的探讨
(Guójiā zhànlüè zài qiánglì tuīdòng yǐ DeepSeek wéi dàibiǎo de jìshù chuàngxīn zài jiāsù pū pò shìchǎng jìngzhēng kōngqián jīliè gè zhǒng yìngyòng chǎngjǐng yě zài kuàisù tuòzhǎn díquè zhè shì yīgè chōngmǎn huólì dàn yě chōngmǎn tiǎozhàn de jiēduàn shāngyè huà de dàolù réng zài mōsuǒ zhōng rúhé pínghéng tóurù yǔ chǎnchū rúhé jiànlì kě chíxù de shāngyè móshì rúhé tíshēng yònghù jiàzhí hé zhān xìng zhèxiē dōu shì fēicháng xiànshí de wèntí tóngshí ne ānquán lúnlǐ hé zhìlǐ de tiǎozhàn yě bànsuízhe jìshù fāzhǎn rìyì tūxiǎn héxīn de nántí shǐzhōng zài zhuīqiú kuàisù chuàngxīn yǔ quèbǎo ānquán gōngpíng hé hù lúnlǐ zhī jiān zhǎodào nàgè wēimiào ér guānjiàn de pínghéng diǎn zhè zhùdìng shì yīgè chíxù tànsuǒ bùduàn tiáozhěng de guòchéng zuìhòu liú gěi nǐ yīgè zhídé shēnrù sīkǎo de wèntí bàogào fǎnfù qiángdiào xiàng DeepSeek zhèyàng de móxíng tōngguò suànfǎ hé gōngchéng shàng de chuàngxīn zài yīdìng chéngdù shàng jiàngdīle duì chúncuì suàn lì guīmó de yīlài yīrán qǔdéle shìjiè jí de chéngguǒ zhè duì wèilái quánqiú AI de jìngzhēng géjú kěnéng yìwèizhe shénme yóuqí shì zài zīyuán huòqǔ tèbié shì jiānduān yìngjiàn kěnéng miànlín xiànzhì de qíngkuàng xià qiǎomiào de suànfǎ chuàngxīn hé gōngchéng yōuhuà huì bù huì chéngwéi bǐ pángdà zīyuán tóurù gèng jù juédìng xìng de lìliàng ne gǎnxiè shōutīng běncì de tàntǎo)
국가 전략은 강력하게 추진되고 있으며, DeepSeek로 대표되는 기술 혁신은 빠르게 돌파구를 마련하고 있고, 시장 경쟁은 전례 없이 치열하며, 다양한 응용 시나리오도 빠르게 확장되고 있습니다. 확실히 활력이 넘치지만 동시에 도전 과제도 많은 단계입니다. 상업화의 길은 여전히 모색 중이며, 투자와 산출의 균형을 맞추는 방법, 지속 가능한 비즈니스 모델을 구축하는 방법, 사용자 가치와 충성도를 높이는 방법 등은 매우 현실적인 문제입니다. 동시에 기술 발전과 함께 안전, 윤리, 거버넌스 문제도 점점 더 두드러지고 있습니다. 핵심적인 난제는 항상 빠른 혁신을 추구하는 것과 안전, 공정, 윤리를 보장하는 것 사이에서 미묘하고 중요한 균형점을 찾는 것입니다. 이는 분명히 끊임없이 탐색하고 조정하는 과정이 될 것입니다. 마지막으로 깊이 생각해볼 만한 질문 하나를 남깁니다. 보고서는 DeepSeek와 같은 모델이 알고리즘과 엔지니어링 혁신을 통해 순수한 연산력 규모에 대한 의존도를 어느 정도 줄이면서도 세계적인 수준의 성과를 달성했다는 점을 거듭 강조했습니다. 이는 특히 자원 확보, 특히 첨단 하드웨어에 제약이 있을 수 있는 상황에서 미래의 글로벌 AI 경쟁 구도에 어떤 의미를 가질 수 있을까요? 정교한 알고리즘 혁신과 엔지니어링 최적화가 막대한 자원 투자보다 더 결정적인 힘이 될 수 있을까요? 이번 논의를 들어주셔서 감사합니다.


中国人工智能产业深度解析学习指南

I. 报告背景与核心洞察

A. 研究背景

  • 政策驱动: 2024年中央及地方政府将人工智能列为重点发展方向,出台大量政策支持创新,提升区域科技竞争力。2025年2月,习近平总书记强调民营企业在人工智能产业中的战略地位。
  • 技术突破: 2025年初,DeepSeek等国产开源大模型兴起,以高性能、低成本特点推动中国AI生态开放与竞争力提升,加速模型国产化并激发应用层创新。
  • 研究方法: 艾瑞人工智能研究团队通过专家访谈、桌面研究、案例实证、行业对比及投融资数据统计得出报告成果。

B. 核心摘要

  • 宏观环境: 国家战略地位提升,地方政策因地制宜。GDP增速放缓但AI作为新质生产力前景广阔。
  • 产业动态:
  • 市场规模: 2024年中国AI产业规模2697亿元,增速26.2%,略低于预期,主要因大模型实际业务表现和建设成本高。
  • 算力需求: 2024年部分智算中心闲置系供需错配,DeepSeek等开源模型推动推理应用爆发,推理算力需求大涨。
  • 工具生态: 分布式AI框架、LLMOps平台和一体机产品日益完善,加速大模型训练与部署。
  • 商业模式: 政企侧以项目制为主,C端多采用“免费+订阅制”,新兴模式为按应用效果或功能点收费。
  • 全球化战略: 国内竞争激烈,企业积极出海,在图像、视频、社交等领域突破。
  • DeepSeek影响: 刷新市场认知,开源策略加速中国AI产业向高效、开放、自主方向发展。
  • 发展趋势:
  • AI Agent: 重塑大模型产品应用形态,向完成复杂任务的智能代理演进。
  • 具身智能: 下一代AI竞争战略高地,需解决软硬件优化和跨行业协作挑战。
  • 技术普惠: DeepSeek开源开放推动大模型技术普及。
  • 安全治理: 构建面向新一代AI的安全治理体系至关重要。

II. 中国人工智能产业宏观环境分析

A. 政策环境

  • 国家战略: 人工智能被纳入国家发展战略,出台政策推动技术创新、资源建设、标准建立和行业应用。
  • 地方响应: 北京、上海、成都、深圳等城市积极响应,将AI纳入地方发展规划,形成“百花齐放”态势。
  • 北京: 加大科研投入,建设算力基础设施,打造产业创新高地。
  • 上海: 聚焦产业集聚和生态建设,推动AI技术在金融、制造、生物医药等领域应用,促进AI开源生态发展。
  • 高维规范建设: 中央层面进行数据、算力、规范、标准、技术的高维规范建设。

B. 经济环境

  • GDP增速放缓: 2020年受疫情影响GDP增速降至2.2%,后有所恢复但仍低于疫情前水平。2024年GDP增速4.2%。
  • CPI低位运行: 近年来CPI指数呈下降趋势,显示通缩压力,经济环境相对低迷。
  • 挑战与机遇: 经济低迷带来投资减少、融资难度增加、市场需求萎缩的挑战;但AI技术在提升效率、创新业务模式方面优势明显,国家政策支持下有望助推经济回温。

C. 资本环境

  • 投资轮次: 战略及股权投资显著上升,股权投资占比高达77.9%。
  • 投资领域: 语言及多模态赛道最受瞩目,基础层投资(如AI芯片)显著上升,AI芯片占比约50%。这表明应用层发展带动基础层建设,完善产业生态。

D. 社会环境

  • 公众认知提升: ChatGPT发布(2022年11月)被27.2%的民众视为AI到来标志事件。生成式AI普及加速市场教育,文本写作和图片生成是主要尝试功能。
  • 焦虑与不安: 超过半数人认为AI产品和服务带来焦虑。AI可能替代重复性工作,且对AI了解越多的人负面情绪越高。
  • 安全隐私问题: AI可能被恶意利用,引发虚假信息、网络攻击、诈骗、恐怖活动等威胁社会安全稳定。

E. 技术环境

  • 模型架构演进:
  • 小模型: CNN(图像处理)和RNN(时序数据处理)成熟度高、成本低,在特定领域仍有优势。
  • 大模型: Transformer架构(2017年)奠定基础,GPT系列、BERT等推动大模型时代到来。GAN(生成模型)和Diffusion Model(扩散模型)在生成图像、音视频方面表现优异。
  • Scaling Law与技术优化:
  • Scaling Law: 增加计算量、参数量、数据量可提升模型性能,但效果递减。头部厂商仍在投入,但部分厂商已放缓投入,转而探索其他技术路径。
  • 思维链(CoT)优化: 结合强化学习,提升模型推理能力,尤其在复杂计算、科学研究方面。DeepSeek开源R1系列推动推理思考技术进步。
  • 跨模态响应: 融合大语言模型、视觉理解/生成模型,实现高效多维度交互。OpenAI GPT 4o系列在文本、语音、图像多模态融合方面表现突出。

III. 中国人工智能产业发展现状与趋势

A. 产业规模

  • 2024年规模: 2697亿元,增速26.2%,低于预期。原因在于大模型业务场景表现未达预期、建设成本高,以及模型计算成本下降和竞争激烈。
  • 未来预测: 2025-2029年CAGR(复合年增长率)32.1%,预计2029年突破1万亿市场规模。DeepSeek开源、推理及多模态能力增强、智能体开发成熟、大小模型协同等因素将推动快速增长。

B. 算力产业影响

  • 算力闲置原因: 2024年部分智算中心闲置系产业规划错配、供给侧前置布局、训练需求放缓等。
  • 推理算力需求大涨: DeepSeek V3及R1模型开源及产品破圈,模型应用端需求爆发,推理算力需求将大幅增长,智算中心利用率有望提高。
  • 自主可控: DeepSeek通过算法优化(如稀疏注意力、混合专家系统)降低训练成本,减少对高端GPU依赖,增强中国AI产业自主可控能力。

C. 基础层工具产品

  • 分布式AI开发框架: DeepSpeed、Megatron、Colossal-AI等提升大模型分布式训练和推理效率。
  • LLMOps平台: 应对大模型开发、应用及部署对算力、数据管理等更高要求,加速模型生命周期管理。
  • 一体机产品: 软硬件集成解决方案,降低企业应用大模型技术门槛,加速行业落地,尤其受私有化部署需求高的B端客户青睐(如DeepSeek适配一体机)。

D. 应用层市场策略

  • “跑马圈地”: 国内大模型厂商通过价格战(字节跳动、阿里云、百度等降价)和流量投入(Kimi、豆包、元宝等广告投放)抢占市场。
  • 定制化与产品化: 面向ToB客户提供Post-pretrain、SFT精调、RLHF等微调方案,将大模型解决方案深度嵌入企业需求。

E. B端大模型商业化进程

  • 项目制主导: 短期内B端项目制落地仍是大模型基座能力变现主要方式。
  • 快速增长: 2024年大模型项目数量和金额快速增长,主要落地于政务、教科、通信、能源等领域。
  • 生态合作: DeepSeek V3与R1开源推动B端产业生态合作,基础层(沐曦、天数智芯)、模型平台层(阿里云、华为云)、应用层(钉钉、吉利汽车)纷纷接入DeepSeek生态。

F. C端AI产品生态

  • 产品类型与商业模式: 涵盖内容创作、智能对话、情感陪伴、效率工具、音视频生成等。主要采取“免费+订阅制”。
  • 壁垒低与用户黏性不足: AI产品壁垒低,用户黏性与收费持续性不足,产品形态尚未稳定,生态壁垒未建立。
  • 大厂生态优势: 互联网大厂在AI产品渠道和流量池中具有强生态优势。

G. 深层产品洞察:AI Coding

  • 产品优势: 提升编码效率、减少人为错误、简化开发流程。
  • 技术进展: Claude-3.5-Sonnet等模型提升编程能力,推动Cursor、Devin等产品应用。
  • 演进方向: 从辅助性Copilot向自主性Agent演进,有望降低编程门槛,实现编程民主化。
  • Coding for Developers: 针对专业开发者,提供代码审查、补全、调试、生成功能。
  • Coding for Everyone: 通过图形化界面、自然语言描述,使非专业人士也能参与软件开发。

H. 深层产品洞察:AI Agent

  • 定义与作用: AI Agent是能自主感知、决策、执行任务的智能体,作为“桥梁”支撑大模型落地应用,补足其对接业务需求、上下文记忆、主动规划执行、多任务协作能力。
  • 市场生态分化: 互联网科技巨头、垂直领域科技厂商、Agent开发平台厂商、原生Agent应用厂商。
  • 发展困境: 仍限于对话式沟通,产品同质化,主动性、记忆、执行感知能力待提升,多智能体协作生态未培育。
  • 技术拐点: 大模型推理能力与工具调用生态升级,市场需求推动AI Agent从认知到执行的突破,初步实现跨域任务整合、任务链自主拆解等。
  • 未来演进: 向复杂任务持续演进,加速走向“决策-执行-反思”的自主闭环能力。

I. 深层产品洞察:AI硬件

  • 端侧AI普及: 2024年AI成为手机、电脑主力卖点,国产手机(华为、荣耀、小米等)打造端侧大模型,提供AI消除、AI搜索对话、生活助手等功能。
  • 新硬件探索: 字节跳动推出AI智能体耳机Ola Friend,科大讯飞推出AI学习机。Rabbit R1、AI Pin等新产品仍在探索中,尚未形成破圈效应。
  • 流量入口: AI硬件寻求规模效应突破,承载更多流量入口,通过人机协同获取市场份额。

IV. 中国人工智能产业商业进程

A. 语音模态

  • 投融资: 战略及股权投资占比超70%。
  • 产品形态: AI语音解决方案(物联网、工业、政务、教育等)和AI生成(文娱消费为主,如AI音乐生成)。
  • 技术演进:
  • 语音识别(ASR): 数据量和参数量增大,结合大模型提供上下文理解,提升识别率、说话人分离、多方言覆盖能力。
  • 语音合成(TTS): 从被动生成发展到主动创作,出现AI语音设计、AI音乐创作。
  • 语音交互: 从ASR-LLM-TTS级联式架构升级为端到端语音交互大模型(如OpenAI GPT 4o、科大讯飞星火),提升响应速度、流畅度、打断性,但可能带来幻觉问题。
  • 产品创新机遇: AI语音克隆、声音设计/转换、AI音频/音乐创作等领域涌现创新。

B. 视觉模态

  • 投融资: 早期融资(C轮以前)超半数,集中于机器视觉和AI图像/视频/3D影像生成。生成类企业多为新兴企业(2023年及以后成立),但机器视觉赛道商业化更成熟。
  • 技术演进:
  • Transformer架构主旋律: 借鉴语言领域成功经验,应用于CV大模型(ViT)提升泛化、理解及处理复杂影像能力。
  • Diffusion Transformer(DiT): 为扩散模型带来新思路,生成高质量图像。Sora、Stable Diffusion 3等模型采用DiT架构,提升真实性、可控性、可编辑性。
  • ControlNet: 条件控制插件,精细控制生成内容。
  • 产品定位:
  • AI图像/视频分析: 以机器视觉为基础,应用于安防、金融、医疗、工业等ToB与ToG市场,大模型融合提升识别理解和动态分析能力。
  • AI图像/视频生成编辑: 面向中小B及C端市场,如剪映、美图、Sora等,在电商、零售、设计、游戏等行业应用。
  • AI视觉搜索问答: 依托大语言模型与视觉理解模块,实现视觉问答、以图搜图等功能。

C. 语言模态及多模态

  • 投融资: 早期投资占比高(C轮以前53.6%),文娱消费和医疗是最热门领域。
  • 文娱消费: 近半数企业为新兴力量(2023年及以后成立),产品形态多样。
  • 医疗: 超八成企业成立于2022年及以前,产品以AI创新研发平台为主。
  • 多模态技术路径:
  • 生成向(DiT架构): 侧重内容生成,如Sora、通义万相等视频生成模型。
  • 理解向(MLLM架构): 侧重信息理解,广泛应用于AI搜索问答对话产品,如ChatGPT、豆包、kimi。
  • 未来趋势: 技术深度融合,兼具生成与理解能力是关键方向。
  • AI产品类型:
  • AI搜索问答翻译: 大厂主导C端市场,如秘塔AI搜索、豆包、Kimi、DeepSeek。
  • AI情绪陪伴: 聚焦情感方向,结合语音和多模态交互,如星野、WoW、猫箱。
  • AI Coding: 从辅助型Copilot向自主型Agent演进,如通义灵码、文心快码、Trae。
  • AI企业员工/个人助手: B端用于企业业务处理,C端提供日程安排、知识管理等。

D. AI产品商业模式

  • 主流模式:
  • 项目制收费: G端与B端项目制部署为主,由运营商、云厂商、AI厂商主导。
  • 订阅制收费: B端与C端广泛应用,初期免费体验,后期引导付费订阅。可分为功能模块额外收费、整体产品价格上调、AI原生应用产品收费。
  • MaaS(Model as a Service): 基于平台按量提供AI能力及产品服务。
  • 按量收费: 部分AI图像/视频生成产品按生成次数收费,B端主要为API调用次数。
  • 流量变现: C端通过单点工具吸引流量,通过广告、平台抽成等变现。
  • 创新模式:
  • 按对话结果/应用效果收费: 降低客户采购决策成本,倒逼供应商优化产品服务。
  • 按功能点收费: C端产品通过单点功能吸引用户付费。
  • 影响因素: 用户IT支出缩减、AI取代人力、客户观望态度等。

E. AI产品出海尝试

  • 出海背景: 海外市场空间广阔、用户付费习惯成熟、竞争相对宽松、语言文化壁垒降低、部分市场监管宽松。
  • 出海策略: 选择特定地区(英语国家、新兴国家、垂直文化国家),产品策略(AI图像/视频、AI社交/情感陪伴为主),团队本地化。
  • 挑战: 海外市场认知差异、消费者对中国品牌信任度、数据跨境隐私、监管合法合规(版权水印、违禁词审查、风控警戒)。

V. 中国人工智能产业标杆案例

A. 字节跳动

  • 产品布局:
  • 基础大模型: 自研豆包系列(大语言、多模态、视觉、语音、角色扮演模型),并提供第三方模型。
  • 大模型开发平台: 火山方舟,提供体验、精调、评测、推理、Prompt优化等功能。
  • 智能体开发平台: 扣子(零代码搭建AI应用,生态繁荣)、HiAgent(专注于企业应用)。
  • 大模型应用层: 面向普通用户(写作等)和专业开发者/企业(各类助手工具)。
  • 豆包AI助手: 多模态AI助手,生态深度融合豆包大模型、扣子开发者生态、火山引擎算力。功能涵盖文案创作、PDF问答、长文本分析、学习辅助、图像/音乐生成、信息搜索、智能体等。

B. 阿里邮箱

  • 产品价值: 国内领先的企业邮箱产品,与钉钉融合提供即时+异步协同办公。已实现Outlook等产品的国产化替代。
  • AI赋能: 提升反垃圾、数据安全、内容生成、多语言翻译服务能力。将电子邮件作为AI工作流信息输入端,解决业务问题。
  • 智能业务场景:
  • 基础: 多种大模型接入(通义千问、DeepSeek等)。
  • 初阶: 邮件文本处理(读、写、搜)。
  • 高阶: 场景邮件流转(识别业务信息,触发RPA工作流)。
  • 进阶: 三方应用接入(宜搭、审批等)。
  • AI工作流: AI识别业务信息,将邮箱数据格式化为自动化工作流的“元数据”,接入企业人、财、物、产、供、销等业务系统。

C. DeepSeek (深度求索)

  • 公司定位: 2023年成立,专注于人工智能基础技术研究,探索AGI实现路径。
  • 模型家族: 推出通用模型V系列、推理模型R系列、代码模型、数学推理模型、多模态模型等,多款开源。
  • V3-0324: 660B参数轻量化部署,推理、前端开发、中文写作、中文搜索、工具调用等能力提升。
  • R1: 数学、代码、自然语言推理性能比肩OpenAI o1正式版。
  • 开源策略与创新:
  • 开源内容: 模型权重、技术论文、训练细节及部分工程代码。
  • 技术突破: DeepSeek V3通过MoE、MLA、MTP、FP8等工程优化实现低成本高效能训练与推理。DeepSeek R1通过GRPO强化学习训练和推理为中心的强化学习,证明纯强化学习路径可行性。
  • 产业价值: 推动技术普惠与平权,加速大模型向产业端和消费端应用渗透。
  • 技术侧: 启示AGI实现路径,推动AI技术范式从监督微调向自我推理演进,竞争范式向“以效率换规模、以创新换算力”转变。
  • 应用侧: 降低应用门槛,提升模型能力,促进B端(本地部署、垂直模型)和C端(全民市场教育、杀手级应用、AI硬件落地)应用繁荣,推动国产替代。

VI. 中国人工智能产业趋势洞察

A. AI Agent的进阶

  • 拐点出现: 大模型推理能力与工具调用生态升级,市场需求推动AI Agent从被动响应的“对话工具”进化为主动执行的“数字劳工”。
  • 能力体现: 初步实现跨域任务整合、任务链自主拆解、深度决策支持等。
  • 挑战: 大模型幻觉、规划逻辑稳健性不足、工具调用能力有限等。
  • 市场创新: 开源生态蓬勃发展(DeepSeek、Qwen),MCP等工具协议加速扩容。
  • 未来演进: 在模型能力、工具生态、市场需求协同下,Agent将向复杂任务持续演进,加速走向“决策-执行-反思”的自主闭环能力顶点。

B. 物理AI的演进

  • 战略高地: 物理AI融合数字智能与物理世界,成为下一代AI竞争高地。
  • 核心: 构建具备多模态感知与具身行动能力的智能系统,保障物理实体行为的反应速度、操作精度、决策智能度。
  • 发展挑战: 软硬件技术升级、跨行业生态协作、伦理规范等瓶颈。
  • 演进路线: 从基础运动与控制到多模态环境感知适应,再到跨物理域任务规划、虚实闭环跨模态生成,最终实现类人通用物理AI。
  • 应用场景: 机器动作表现、工业机器操控、老年陪护、家庭管家等。

C. 人工智能安全治理体系的构建

  • 风险挑战: 从理论威胁演变为现实挑战,生成式AI、自动驾驶等场景标准缺失、监管滞后。
  • 安全风险分类:
  • 内生安全: 数据安全(隐私保护、未经授权训练数据、提示注入、模型投毒),算法安全(可解释性缺陷、算法偏见、模型幻觉)。
  • 应用安全: 内容安全(虚假信息传播、信息茧房加剧),责任归属风险(内容知识产权、错误决策追责),违法犯罪滥用(欺诈、攻击),情感伦理风险(过度依赖、权力让渡)。
  • 治理框架: 构建动态、前瞻的治理框架,从技术、商业、法律、伦理等多角度协同发力,通过政策引导、行业自律与国际协作,确保AI安全发展。

VII. 中美AI竞争与中国战略

A. 中美AI竞争格局

  • 美国优势: 私营部门创新、前沿研究(AGI)、AI模型开发、投资、先进计算基础设施。
  • 顶尖模型: 全球最重要的50个顶级AI模型中,美国机构独占40个(OpenAI GPT、Google Gemini、Anthropic Claude)。
  • 算力霸权: 英伟达GPU及其CUDA-X生态垄断全球90%以上AI训练芯片市场,并通过出口管制限制竞争对手。
  • 中国优势: 大规模部署、应用场景、专利数量。
  • 规模化部署: 大力推进“AI+”行动,工业机器人安装量、AI视觉和决策系统应用规模全球领先。
  • 专利数量: AI领域专利申请量连续六年世界第一,计算机视觉和自然语言处理应用层专利优势明显。
  • 独角兽公司: 中国AI独角兽88家,美国50家。
  • AI基础设施: 中国22家,美国12家。美国估值领先(Gong.io 72.5亿美元),中国ESWIN奕斯伟估值不到50亿美元。
  • 通用人工智能: 美国14家(xAI, OpenAI等),OpenAI估值290亿美元。中国8家,月之暗面估值约30亿美元,普遍成立较晚。
  • AI行业应用: 中国58家,美国20家。中国在自动驾驶、物流/配送/仓储机器人、AI+医疗等领域进展显著。美国Nuro估值约90亿美元,高于中国同类企业。

B. 中国的“开源+硬件”战略

  • 核心策略: 放弃短期软件利润,豪赌开源,以换取对整个产业链的长期控制权。
  • 第一步:开源模型“降维打击”:
  • 引领开源浪潮: 阿里巴巴通义千问Qwen、DeepSeek、字节跳动豆包、智谱AI ChatGLM等高性能大模型免费开源。
  • 冲击西方商业模式: 将AI大模型从“奢侈品服务”拉回到“公共基础设施”定位,瓦解西方昂贵的API调用和软件授权模式。
  • 第二步:“升维控制”——硬件绑定:
  • 软硬件解耦与再耦合: 开源使AI软件与硬件理论上自由结合,但高效具身智能需深度协同优化。
  • 中国制造业优势: 提供与开源模型适配最好、成本最低、品类最全的硬件矩阵(AI芯片、服务器、智能家居、机器人、无人机等)。
  • 生态锁定与成本锁定: 引导全球开发者和企业使用中国开源模型并最终被引导至中国硬件生态圈。
  • 反脆弱性: 开源模式利用全球开发者力量进行“压力测试”和“功能优化”。

C. 硬件为王的时代

  • 稀缺性逆转: AI时代软件趋于“富余化”,硬件重新变得“稀缺”。
  • 高端芯片: AI对算力需求巨大,高端芯片制造困难,供应链壁垒高。
  • 复杂硬件制造: 机器人、机器狗、农业机器人等复杂硬件的稳定、低成本、大规模制造能力成为巨大壁垒。
  • 战略资源: 硬件不再是廉价商品,而是兵家必争的战略资源。

D. 中国的未来推演与挑战

  • 堵点: 高端机器人精密减速器等核心部件瓶颈;西方可能强化芯片制造设备封锁;“去中国化”硬件生态联盟。
  • 内部探索路径:
  • 算法优化派: 如DeepSeek,用软件极致优化弥补硬件短板,“软件定义算力”。
  • 生态一体化派: 如阿里、百度,提供从算力到应用的“水电煤”式全家桶服务。
  • 底层自主派: 如华为昇腾、寒武纪,打造100%自主可控的“备用系统”。
  • 全球化战略: “农村包围城市”战略,以极低成本赋能发展中国家市场,构建庞大非西方AI生态圈。
  • 终局之战: 决定胜负的关键在于谁掌握生产资料(硬件),谁就拥有定义世界的话语权。

E. AI在医疗领域的应用与准入

  • 应用现状: 虚拟助手、疾病诊断与预测、医疗影像、病历/文献分析、医院管理、智能器械、新药研发、健康管理和基因等9大类。
  • 国外: IBM Watson(肿瘤治疗)、Google DeepMind Health(辅助决策、隐私保护)。
  • 国内: 百度医疗大脑、阿里健康“Doctor You”、科大讯飞智医助理(通过执业医师考试)。
  • 布局不均衡: 国内40家初创企业涉足医疗影像,远高于其他领域,特别在新药研发、基因等高精技术领域涉足较少。原因包括深度学习在图像识别突破、医疗影像数据丰富、商业化较快、高精技术研发能力相对较弱。
  • 现存问题:
  • 数据问题: 医疗数据标准化低、共享机制弱、电子化程度不足。数据隐私保护制度缺失(与美国HIPAA法案对比)。
  • 医疗本身问题: 临床诊断复杂性、现代医学未解难题限制AI应用。
  • 医保支付问题: AI开发引进费用高,医疗机构引进动力不足。
  • 责任风险问题: AI诊断结果签字权、技术准入和管理法律监管缺失。
  • 人才培养: 传统医学人才培养模式亟待转变,懂AI的医生将取代不懂AI的医生。
  • 准入管理:
  • 美国: 《21世纪治愈法案》拨款改革药物审批程序,FDA成立专门部门审评数字化医疗和AI技术。
  • 中国: 卫生计生委修订医疗技术管理规范,CFDA将决策支持、辅助诊断医用软件定义为Ⅲ类医疗器械,但尚未成立专门审评部门。
  • 未来展望: AI可弥补人力资源不足、实现持续监测、提高医疗准确度。需在法治、监管、技术、标准等方面做好规范,限制AI向利好人类方向发展。

F. 中国“人工智能+”行动的意见 (2025年8月26日)

  • 总体要求: 推动AI与经济社会广泛深度融合,重塑生产生活范式,促进生产力跃迁和生产关系变革,形成人机协同、跨界融合、共创分享的智能经济和社会新形态。
  • 发展目标:
  • 2027年: AI与6大重点领域深度融合,新一代智能终端、智能体普及率超70%。
  • 2030年: AI全面赋能高质量发展,智能终端、智能体普及率超90%,智能经济成为重要增长极。
  • 2035年: 全面步入智能经济和智能社会新阶段。
  • 重点行动:
  • 科学技术: 加速科学发现进程,驱动技术研发模式创新,创新哲学社会科学研究方法。
  • 产业发展: 培育智能原生新模式新业态,推进工业全要素智能化发展,加快农业数智化转型升级,创新服务业发展新模式。
  • 消费提质: 拓展服务消费新场景,培育产品消费新业态(智能网联汽车、AI手机/电脑、智能机器人、智能家居等)。
  • 民生福祉: 创造更智能工作方式,推行更富成效学习方式,打造更有品质美好生活(居民健康助手、文化生产传播、人际关系、养老托育等)。
  • 治理能力: 开创社会治理人机共生新图景,打造安全治理多元共治新格局,共绘美丽中国生态治理新画卷。
  • 全球合作: 推动AI普惠共享,共建AI全球治理体系。
  • 强化基础支撑能力: 提升模型基础能力、加强数据供给创新、强化智能算力统筹、优化应用发展环境、促进开源生态繁荣、加强人才队伍建设、强化政策法规保障、提升安全能力水平。

G. 中国AI监管新时代:《生成式人工智能服务管理暂行办法》

  • 背景: AIGC技术爆发,对全行业产生颠覆性影响。国内研学界将AIGC理解为新型内容生产方式和技术集合。
  • AIGC使用场景:
  • To C: 降低内容生成成本,应用于搜索引擎优化、文娱、游戏、动漫、智能客服等。未来将有更强人机交互能力。
  • To B: 提升生产效率,应用于智能客服、智能办公软件、金融数据分析、制造业自动化、ERP系统结合等。未来将完善决策式AI并增强垂类细分功能。
  • 市场规模: Gartner预测2025年AI生产数据占比达10%;Acumen预测2023年全球AIGC市场规模1100亿美元,国内智库预测2023年国内AIGC市场突破170亿人民币。
  • AI立法监管趋势:
  • 美国: 《生成人工智能网络安全法案》、《人工智能能力与透明度法案》规范数据隐私。
  • 欧盟: 《人工智能法案》确保安全使用。
  • 中国: 国家网信办等六部门发布《生成式人工智能服务管理暂行办法》(2023年8月15日施行),依托上位法构建体系化治理框架。
  • 《暂行办法》重点内容:
  • 规范主体及适用范围: 适用于向中华人民共和国境内公众提供生成文本、图片、音频、视频等内容的服务。明确“境内公众”和“提供”行为认定。
  • 相关主体合规义务:
  • 服务提供者: 内容合规(合法、处置不良信息、未成年人保护)、数据处理及标注合规(合法来源、提高质量、明确规则)、隐私数据合规(授权同意、响应机制、风险评估)、安全评估和算法备案(具备舆论属性或社会动员能力的服务)。
  • 开发者及服务使用者: 不得制作、复制、发布损害国家利益、社会公共利益和他人合法权益的信息,抵制不良影响信息。
  • 与知识产权及不正当竞争合规衔接: AIGC技术依赖大量数据挖掘和训练,需规制知识产权和不正当竞争行为。
  • 合规风险提示:
  • 开发者: 数据爬取风险、数据安全风险、合作方权责划分风险。
  • 服务提供者: 内容管控风险、数据安全风险、个人信息处理合规风险。
  • 使用者: 敏感数据泄露风险。
  • 合规建议及应对措施: 规范数据处理、开展安全评估及算法备案、识别数据跨境场景并评估、定期开展AI模型安全测评、加强员工培训、引入AI风险管理专业角色。

VIII. Elon Musk对AI、Optimus和Starlink的看法

  • Optimus (擎天柱):
  • 愿景: 将成为“人类有史以来最伟大的产品”。
  • Progress: Version 3设计定稿,具备人类般灵巧的双手和AI心智,能导航和理解现实。
  • 关键缺失: 手部灵巧性、导航和理解现实的AI心智、大规模生产。
  • 投入: Elon Musk投入大量精力,可能是其所有项目中最多的精神投入。
  • 挑战: 供应链不存在,需从零开始垂直整合(包括执行器、电机、变速箱、电力电子等)。
  • 成本与时间: 大规模生产(每年百万台)边际成本约2万美元,可能在20-25K美元。预计可在2030年前后购买。
  • 人形设计原因: 人类设计了世界,人形机器人能立即与现有环境兼容。
  • AI芯片 (Dojo/AI Force):
  • Tesla两大芯片项目: Dojo(训练侧)和AI Force(推理侧)。
  • AI Force 4: 目前用于所有Tesla车辆。
  • AI 5: 将比AI 4性能提升40倍,主要通过优化softmax操作和动态混合精度处理,原始计算能力提升8倍,内存提升9倍,内存带宽提升5倍。AI硬件和软件团队协同设计。
  • Full Self-Driving (FSD): AI 4芯片有望实现比人类驾驶安全2-3倍甚至10倍。Version 14将大幅升级,参数量增加一个数量级,使用强化学习,解决压缩步骤中的“有损”问题。
  • Grock (XAI):
  • 演进: 利用大量推理计算和推理能力审查人类知识语料库,纠正错误,添加缺失信息,删除虚假内容,以创建更准确的训练数据。
  • “Gropedia”: 建议将纠正后的信息公开,作为更可靠的知识来源。
  • Scaling Law: AI模型智能随计算量呈自然对数函数关系,10倍计算量可使智能翻倍。
  • 未来智能预测: AI有望在明年超越任何单个人类,并在2030年左右超越所有人类智能的总和。
  • Starlink 智能手机直连:
  • 目标: 从卫星直接提供高带宽连接到手机。
  • 技术与时间: 需手机芯片修改以支持新频率(约2年时间),并行建设支持这些频率的卫星。
  • 功能: 手机上可随时随地观看视频,在普通房屋内也可使用。
  • 商业模式: 提供Starlink作为全球运营商选项之一,不淘汰现有运营商。
  • Starship (星舰):
  • 重用性: 预计明年实现完全重用性,包括回收助推器和飞船。
  • 版本3: 巨大升级,配备Raptor 3引擎,可将超过100吨载荷送入轨道并完全重用。
  • 技术挑战: 可重用轨道热防护罩的材料科学和工程问题。
  • 西方文明的担忧:
  • “自杀式同情”: 对西方文明的未来感到担忧,认为其行动“与自杀无异”。
  • 出生率下降: 低于替代水平,导致人口结构性问题。
  • 开放边境: 导致文化融合问题和社会结构破坏。
  • 精英媒体不作为: 对犯罪等社会问题拒绝报道或承认。
  • 缺乏乐观主义和目标: 年轻一代对未来缺乏希望,导致生育意愿低下。
  • 宗教缺失: 认为宗教缺失留下的空缺被“觉醒”意识形态("white work mind virus")填补,具有破坏性。
  • 解决方案: 需要重新树立乐观主义和目的感,相信未来会更好,并可能需要某种形式的“宗教复兴”或连贯的哲学。
  • 个人哲学: 以好奇心驱动,探索宇宙本质,扩展意识,使人类成为多行星物种。
  • 火星殖民:
  • 目标: 在火星建立自给自足的城市。
  • 重要性: 实现行星冗余,大幅延长意识的可能寿命,以防地球毁灭性事件(核战、病毒、陨石等)。
  • 时间表: 在最佳情况下,可能在30年内实现,通过每两年一次的火星转移窗口实现指数级吨位增长,约25年内实现自给自足。

测验

说明:请用2-3句话简要回答以下问题。

  1. 2024年中国人工智能产业的市场规模为何略低于预期?
  2. DeepSeek的开源策略对中国AI产业生态产生了哪些关键影响?
  3. 《经济学人》和《2024年中国人工智能产业研究报告》在评价中美AI竞争时,各侧重哪些方面?
  4. 中国在AI领域采取“开源+硬件”战略的核心逻辑是什么?
  5. Elon Musk认为未来AI芯片AI5相对于AI4将带来哪些显著的性能提升?
  6. AI Agent在当前发展中面临的主要困境是什么,其未来演进方向如何?
  7. 中国在“人工智能+”行动中,如何计划推动服务业从数字赋能向智能驱动转型?
  8. 《生成式人工智能服务管理暂行办法》对生成式人工智能服务提供者提出了哪些主要的内容合规义务?
  9. 中国医疗AI初创企业在应用领域布局上存在哪些不均衡现象?其原因是什么?
  10. Elon Musk为何认为将Tesla Optimus设计成人类形态是必要的?

测验答案

  1. 2024年中国人工智能产业市场规模略低于预期,主要原因在于大模型在实际业务场景中的表现未完全满足客户需求,且其建设成本较高,导致很多项目仍处于探索阶段。此外,模型计算成本的下降以及供应商之间的激烈竞争也限制了市场增长。
  2. DeepSeek的开源策略刷新了市场对大模型性能的认知,以高性能、低成本的特点吸引了大量开发者和企业。这显著加速了中国AI产业向更加高效、开放和自主的方向迈进,并带动了产业链上下游的合作与应用落地。
  3. 《经济学人》认为美国在技术、前沿研究和模型开发方面领先,而中国在规模化应用、专利总量上占优,并侧重于意识形态和治理模式的比较。《2024年中国人工智能产业研究报告》则从市场规模、算力需求、工具生态、商业模式等具体产业数据分析中美竞争态势。
  4. 中国“开源+硬件”战略的核心逻辑是放弃短期软件利润,通过免费开源高性能模型来瓦解西方软件的收费模式,从而降低全球AI开发和使用门槛。然后,通过掌控AI芯片、服务器、机器人等核心硬件的制造和供应链,形成“生态锁定”和“成本锁定”,实现对整个产业链的长期控制权。
  5. Elon Musk表示AI5芯片相对于AI4在性能上将有40倍的提升,主要是通过优化softmax操作和动态处理混合精度模型。虽然原始计算能力提升8倍,但由于解决了AI4的核心限制,实现了更精细的优化,从而达到了40倍的综合性能飞跃。
  6. AI Agent当前面临的主要困境是产品同质化严重,主动性、记忆能力、执行感知能力有待提升,且多智能体协作生态尚未培育。其未来演进方向是向复杂任务持续发展,加速走向“决策-执行-反思”的自主闭环能力,并实现通用性升级。
  7. 中国在“人工智能+”行动中,计划推动服务业从数字赋能的互联网服务向智能驱动的新型服务方式演进。这包括拓展经营范围、推动现代服务业智能化发展,以及在软件、信息、金融、商务、法律、交通、物流、商贸等领域广泛应用新一代智能终端和智能体。
  8. 《生成式人工智能服务管理暂行办法》要求服务提供者履行内容合规义务,确保生成内容的合法合规,定期监控并处置不良信息。此外,还需为用户提供明确指导,并对未成年人采取额外保护措施,防止其过度依赖或沉迷。
  9. 中国医疗AI初创企业在应用领域布局上存在不均衡,主要集中在医疗影像,而新药研发、基因等高精技术领域涉足较少。这主要是因为深度学习在图像识别领域取得了突破,医疗影像数据丰富且商业化较快,而我国在高精技术领域的研发能力相对较弱。
  10. Elon Musk认为将Tesla Optimus设计成人类形态是必要的,因为人类设计了世界,大部分工具和环境都为人型设计。因此,人形机器人将能立即与我们已经建立的世界实现“向后兼容”,执行人类可以做的各种复杂任务。

论文格式问题

  1. 请详细分析中国政府在《2024年中国人工智能产业研究报告》中所提及的“人工智能+”行动中,如何通过政策引导、经济刺激和社会接受度提升来推动人工智能产业的发展,并探讨这些举措对中国在全球AI竞争格局中的长远影响。
  2. 对比美国在AI技术和算力方面的领先优势与中国在AI规模化部署和专利数量方面的优势,深入探讨中国“开源+硬件”战略如何从根本上挑战西方AI的商业模式,并分析该战略可能面临的“堵点”及中国为此探索的多条应对路径。
  3. 结合Elon Musk对Optimus机器人、Grock AI以及Tesla AI芯片的展望,分析其“软硬一体化”的AI发展理念如何体现在这些产品中。同时,探讨他所担忧的“西方文明自杀式同情”与AI发展之间的潜在关联,以及他提出的解决方案。
  4. 详细阐述《生成式人工智能服务管理暂行办法》在应对AIGC技术带来的合规风险(如数据爬取、内容管控、个人信息处理等)方面所扮演的角色。请探讨该办法如何平衡AI创新发展与风险防范,并提出企业在AIGC应用和发展中应如何有效落实合规措施。
  5. 以中国人工智能在医疗领域的应用现状为例,深入分析其在发展中面临的数据标准化、隐私保护、医保支付和责任风险等挑战。请结合国内外监管经验,探讨中国应如何构建完善的准入管理机制和人才培养模式,以促进医疗AI的健康、可持续发展。

关键词汇表

  • 人工智能 (Artificial Intelligence, AI): 关于“智能主体”研究与设计的学问,指可以观察周遭环境并作出行动以达到目标的系统。通常分为弱人工智能、强人工智能和超人工智能三个层级。
  • 新质生产力: 指以科技创新为驱动,以人工智能等新兴技术为代表,能显著提升效率和推动产业升级的生产力形态。
  • DeepSeek (深度求索): 一家专注于人工智能基础技术研究的科技公司,由幻方量化创始人梁文锋创立。其开源大模型以高性能、低成本著称,对中国AI生态发展产生重要影响。
  • 开源策略 (Open-source Strategy): 一种商业策略,通过免费开放AI模型权重、技术论文和训练细节等,降低技术门槛,吸引全球开发者参与,形成正向循环的生态系统,并冲击传统软件收费模式。
  • 算力霸权 (Computing Power Hegemony): 指一个国家或实体在人工智能训练芯片和相关生态系统(如英伟达的GPU和CUDA-X生态)方面占据绝对主导地位,能够对全球AI发展施加巨大影响。
  • “AI+”行动: 中国政府提出的深入实施人工智能与经济社会各行业各领域广泛深度融合的行动计划,旨在推动产业创新和经济转型。
  • 大模型 (Large Models): 指具有巨大参数量和数据规模的深度学习模型,通过预训练能够执行多种复杂任务,如GPT系列、Gemini等。
  • 推理侧算力 (Inference Computing Power): 指用于运行已训练好的AI模型进行预测和决策所需的计算能力,与训练侧算力(用于模型训练)相对。
  • LLMOps (Large Language Model Operations): 专门针对大语言模型生命周期(开发、部署、管理)的平台工具,旨在加速AI模型开发、部署和管理。
  • 一体机产品 (Integrated Machine Products): 软硬件集成的大模型实践解决方案,通常搭载高性能硬件和AI训练/推理平台,旨在降低企业应用大模型的技术门槛。
  • 项目制 (Project-based): 一种商业模式,主要通过承接定制化的项目来提供产品或服务,通常用于To G(政府)和To B(企业)市场。
  • 订阅制 (Subscription-based): 一种商业模式,用户按一定使用周期(月、年)付费订阅产品或服务,常见于C端产品和SaaS服务。
  • AI Agent (智能代理): 一种能够自主感知环境、作出决策并执行行动的智能体产品,旨在弥合大模型能力与场景应用之间的鸿沟,从被动响应的“对话工具”进化为主动执行的“数字劳工”。
  • 具身智能 (Embodied Intelligence): 将数字智能与物理世界融合的关键技术,指构建具备多模态感知与具身行动能力的智能系统,使AI能够与物理环境进行交互和操作。
  • Transformer架构: 2017年由Google提出的基于自注意力机制的神经网络结构,奠定大模型预训练算法架构的基础,在自然语言处理和计算机视觉领域取得了革命性突破。
  • Diffusion Model (扩散模型): 一种基于概率生成的深度学习模型,通过模拟数据从有序到无序再到有序的过程,实现从噪声中生成高质量数据样本,应用于图像生成、视频生成等。
  • Scaling Law (缩放定律): 表示增加计算量、模型参数量或数据大小都可能提升模型性能,但提升效果会随着这些因素的增加而递减。
  • 思维链 (Chain of Thoughts, CoT): 一种通过强化学习等“后训练”方法优化模型推理能力的技术,使模型在解决复杂问题时能够展现更深层次的思考过程。
  • 跨模态融合 (Cross-modal Fusion): 将不同模态(如文本、图像、语音)的信息进行整合处理,使AI模型能够理解和生成多模态内容。
  • AI Coding (AI编程): 利用人工智能和机器学习技术,通过理解人类语言描述来自动生成代码的工具,旨在提升编码效率和降低编程门槛。
  • 物理AI (Physical AI): 融合数字智能与物理世界的创新范式,构建具备多模态感知与具身行动能力的智能系统,使AI从虚拟助手向实体协作伙伴演进。
  • 《生成式人工智能服务管理暂行办法》: 中国针对AIGC(人工智能生成内容)发布的首份监管文件,旨在规范生成式AI服务的研发、使用和优化过程中的合规要求和风险管理。
  • Grock (格罗克): Elon Musk的XAI公司开发的人工智能模型,旨在通过大量推理计算审查和纠正人类知识语料库中的错误和缺失信息。
  • Optimus (擎天柱): Tesla正在开发的人形机器人,Elon Musk认为其将成为人类历史上最伟大的产品,并致力于解决其手部灵巧性、AI心智和大规模生产等技术挑战。
  • Starlink Direct to Cell: SpaceX旗下的Starlink卫星网络未来将实现直接与智能手机连接,提供高带宽通信服务,旨在实现全球范围内的无缝连接。
  • AI Force芯片: Tesla自主研发的推理芯片,用于自动驾驶和机器人,Elon Musk预测其下一代AI5芯片将带来显著的性能提升。
  • 具身智能 (Embodied AI): 与“物理AI”类似的概念,指AI系统能够在一个物理身体中与真实世界进行交互和感知,具备自主行动和决策能力。
  • 数字劳工 (Digital Laborer): 指AI Agent等智能体从被动响应工具发展为能够主动执行复杂任务,像人类劳工一样完成工作的智能系统。
  • 生态锁定 (Ecosystem Lock-in): 指用户一旦习惯了某个生态系统(如中国开源模型及配套硬件),由于转换成本高、技术路径依赖等原因,很难转向其他生态系统。
  • 向后兼容 (Backward Compatibility): 指新系统或产品能够兼容旧系统或产品的功能和接口,例如人形机器人可以立即适应人类为人类设计好的物理世界。
  • 多令牌预测 (Multi-token Prediction, MTP): DeepSeek V3采用的一种工程优化技术,旨在一次预测多个token,提升训练和推理效率。
  • 混合专家架构 (Mixture of Experts, MoE): 一种神经网络架构,通过多个专家网络协同工作,提高模型的多样性和效率。
  • 多头潜在注意力 (Multi-head Latent Attention, MLA): DeepSeek V3采用的优化技术,通过优化KV缓存使用,减少内存占用,提高推理效率。
  • 强化学习 (Reinforcement Learning, RL): 一种机器学习方法,通过让智能体与环境互动并接收奖励或惩罚来学习最优策略。
  •  

中国人工智能产业发展时间线

早期发展阶段

  • 1955年: 约翰·麦卡锡命名“人工智能”,以区别于诺伯特·维纳的“控制论”。
  • 1956年夏季: 达特茅斯人工智能研讨会后,人工智能作为一个独立研究领域确立。
  • 1972年: 利兹大学研发出AAP Help,是医疗领域最早的人工智能系统,用于辅助腹部剧痛诊断及手术需求。
  • 1978年: 北京中医医院关幼波教授与计算机专家合作开发“关幼波肝病诊疗程序”,首次将医学专家系统应用于中国传统中医领域。
  • 20世纪80年代初: 中国开始进行医疗人工智能的开发研究。
  • 1980年: 卷积神经网络(CNN)的雏形诞生。
  • 20世纪80年代: 出现QMR(Quick Medical Reference)、哈佛医学院开发的DXplain等商业化医疗应用系统。
  • 1996年: 美国颁布《健康保险携带和责任法案》(HIPAA),规定建立国家电子医疗交易保障监督制度,创建医疗信息安全和隐私。
  • 1998年: 现代卷积神经网络的基本结构LeNet-5诞生。美国FDA开始建立监管计算机辅助识别系统。
  • 2002年: SpaceX公司成立,其目标是创造完全可重复使用的轨道火箭。
  • 2003年: 中国发射首个载人航天任务。

2010年代:AI技术突破与国家战略布局

  • 2012年: 深度学习AlexNet在ImageNet竞赛中夺冠,标志AI进入深度学习新阶段;深度学习模型首次应用于ImageNet图像识别大赛,将错误率降至16.4%。美国FDA公布一套明确审查指标来审查集成机器学习算法的软件。
  • 2013年: WeChat推出,并在15个月内获得1亿用户,展示了中国移动互联网的快速发展和创新能力。
  • 2014年: GAN(对抗式生成网络)诞生,深度学习进入生成模型研究新阶段。
  • 2015年: 科大讯飞开始布局AI+医疗产业。Diffusion概率模型的基本概念与整体框架被提出。美国FDA将可控制心脏消融导管远程控制系统定义为Ⅱ类。
  • 2016年3月: AlphaGo击败围棋世界冠军李世石,被中国民众认为是“AI到来”的标志事件之一(由25.5%的受访者认为)。
  • 2016年: 中国FAST望远镜竣工并开始观测。Google公布成立DeepMind Health部门,与英国NHS合作。美国白宫推动成立机器学习与人工智能分委会(MLAI),并发布一系列人工智能战略报告。联合国发布人工智能政策报告。英国下议院的科学和技术委员会发布《机器人技术和人工智能》报告。美国FDA颁布三条规范指导未来医疗AI创新。
  • 2016-2017年: 侧重感知智能的图像技术广泛应用,人脸识别成为代表,商汤、云从等计算机视觉(CV)厂商诞生。
  • 2017年7月: 国务院发布《新一代人工智能发展规划》,制定了中国人工智能三步走发展战略目标。阿里健康发布医疗AI“Doctor You”。
  • 2017年: Google团队提出基于自注意力机制的神经网络结构Transformer架构,奠定大模型预训练算法架构基础。DeepMind宣称将区块链技术应用于个人健康数据追踪。ImageNet挑战赛中,Momenta团队利用SENet架构取得第一,识别错误率2.251%,超过人眼。美国FDA正式授权Bakul Patel博士组建专门致力于数字化医疗和AI技术审评的新部门。国家卫生计生委修订15条“限制临床应用”医疗技术管理规范,包括人工智能辅助诊断。
  • 2017年8月: CFDA发布《药品数据管理规范》意见稿。
  • 2017年9月: CFDA规定申请人应通过总局医疗器械标准管理中心分类界定信息系统提出分类界定申请。
  • 2017年10月: 中共中央办公厅、国务院办公厅印发《关于深化审评审批制度改革鼓励药品医疗器械创新的意见》。阿里健康宣布成立“达摩院”,专注于人工智能等基础科学研究。科大讯飞智医助理通过2017年临床执业医生综合笔试测试,高出分数线96分。
  • 2017年11月: 15个部委确定首批4家国家创新平台,分别依托百度(自动驾驶)、阿里云(城市大脑)、腾讯(医疗影像)和科大讯飞(智能语音)。
  • 2018年: OpenAI发布GPT-1大模型;Google发布BERT大模型。

2020年代:大模型爆发与中国AI产业格局重塑

  • 2020年: 美国发布《生成人工智能网络安全法案》。中国GDP增速降至2.2%受疫情影响。
  • 2020-2021年: Diffusion Model在图像生成领域得到广泛应用。
  • 2021年: 美国发布《人工智能能力与透明度法案》。
  • 2022年: AIGC成为爆发之年。Transformer架构更多融入语音、视觉领域,发展端到端语音大模型、DiT、ViT为代表的视觉大模型。中国GDP增速3.0%。
  • 2022年11月: GPT3.5的ChatGPT面世,引爆互联网,大模型时代随之到来,被27.2%的中国民众认为是“AI到来”的标志事件。
  • 2023年: 全球AIGC市场规模有望达到1100亿美元,中国AIGC市场有望突破170亿人民币。中国AI产业投融资事件中,战略及股权投资占比显著上升。全球AI独角兽企业中,中国有88家,美国有50家。
  • 2023年6月: 欧盟发布《人工智能法案》最新草案。
  • 2023年7月: 妙鸭相机发布。国家网信办等六部门发布《生成式人工智能服务管理暂行办法》。DeepSeek公司成立。
  • 2023年8月15日: 《生成式人工智能服务管理暂行办法》正式施行。
  • 2023年11月: DeepSeek发布开源代码模型DeepSeek Coder和通用大语言模型DeepSeek LLM。
  • 2023年: 大模型训练任务激增,算力出现短缺。月之暗面发布企业级API加码B端。中国工业机器人全球市场份额从2023年的51%上升至2024年的54%。
  • 2024年1月4日: 十七部门印发《“数据要素×”三年行动计划(2024—2026年)》。
  • 2024年1-12月: 中国大模型中标项目数量与金额快速增长,主要落地于政务、教科、通信、能源等领域。
  • 2024年2月: OpenAI发布Sora模型,为视频生成模型、世界空间模型打下标杆产品案例。中国民众中3.5%认为Sora的出现是AI到来的标志。
  • 2024年3月18日: 市场监管总局等18部门联合印发《贯彻实施〈国家标准化发展纲要〉行动计划(2024—2025年)》。
  • 2024年5月: OpenAI发布端到端语音架构的GPT 4o系列,在语音交互能力上表现优异。字节跳动将其大模型计价单位从分降至厘。阿里云宣布通义千问最高降价97%。百度宣布两款主力大模型免费。DeepSeek发布开源MoE模型DeepSeek V2。
  • 2024年5月29日: 中央网信办等三部门印发《信息化标准建设行动计划(2024—2027年)》。
  • 2024年6月: Stability AI正式开源Stable Diffusion 3,采用DiT架构。Anthropic公司发布Claude-3.5-Sonnet模型,在编程能力上取得重大突破。四部门联合印发《国家人工智能产业综合标准化体系建设指南(2024版)》。
  • 2024年8月: 科大讯飞更新星火语音大模型,采用端到端语音架构。DeepSeek合并DeepSeek Coder V2和DeepSeek Chat模型,发布融合通用与代码能力的DeepSeek V2.5。
  • 2024年8月30日: IT桔子发布《2024年中美独角兽公司发展分析报告》,显示中国AI独角兽88家,美国50家。
  • 2024年9月: OpenAI发布o系列模型,提出CoT思维链优化的强化推理路径。全国网络安全标准化技术委员会发布《人工智能安全治理框架》1.0版。
  • 2024年9月初: 《经济学人》发表文章《谁在人工智能中获胜——中国还是美国?》,讨论中美AI竞争。
  • 2024年10月: 荣耀Magic7系列携带全新YOYO智能体发布。字节跳动豆包推出首款AI智能体耳机Ola Friend。智谱华章推出自主智能体AutoGLM。
  • 2024年11月: Anthropic发布MCP(模型上下文协议),其生态加速扩容。零一万物推出面向零售、餐饮行业的数字人解决方案。NVIDIA推出生成AI音频模型Fugatto。DeepSeek发布推理模型预览版DeepSeek-R1-Lite。
  • 2024年12月: DeepSeek V3上线并开源。
  • 2024年: 中国AI产业规模为2697亿元,增速26.2%,略低于预期。部分地区智算中心出现闲置,但推理侧算力需求大幅上涨。中央及各地政府将人工智能产业确立为重点发展方向,出台一系列政策措施。AI芯片投资在基础层赛道中占比超50%。语言及多模态赛道成为最受瞩目的投资领域。生成式AI普及加速市场教育。Transformer架构主导大模型发展。AI Agent开始重塑大模型产品应用形态。手机与电脑将AI作为主力卖点,国产手机纷纷打造端侧大模型。

2025年及未来展望

  • 2025年1月: DeepSeek发布官方APP,支持联网搜索与深度思考模式。
  • 2025年2月: DeepSeek推理模型R1正式发布,其高性能、低成本特点迅速吸引关注,被认为是标志性事件。中共中央总书记、国家主席、中央军委主席习近平在京出席民营企业座谈会并发表重要讲话,强调民营企业的关键角色与人工智能产业的战略地位。OpenAI推出GPT 4.5系列模型,加大模型参数,主要通过无监督训练提升模型通用能力。英伟达股价单日下跌近20%,受DeepSeek V3及R1模型开源影响。
  • 2025年3月: DeepSeek发布新版本V3模型DeepSeek-V3-0324。蝴蝶效应推出通用型AI助手Manus,引发热议,展示了AI执行复杂工作的巨大潜力。
  • 2025年8月21日: 国务院发布《关于深入实施“人工智能+”行动的意见》,部署深入实施“人工智能+”行动,提出到2027年、2030年、2035年的发展目标。
  • 2025年9月9日: 《经济学人》发表文章《谁在人工智能中获胜——中国还是美国?》的引用日期,表明此前的文章讨论了中美AI竞争。虎嗅网文章《AI终局之战:美国目前赢了技术,但中国会赢下未来?》发表,对中美AI竞争格局进行深入分析。
  • 2025年9月11日: 阿里巴巴副总裁韩曦表示AI正成为电商新基建,驱动下一代智能化革命。
  • 未来: Optimus版本3设计完成,预计在2030年左右达到每年百万台的生产规模,成本约为20,000美元/台。特斯拉的AI5芯片将比AI4性能提升40倍。Starlink将实现卫星直接连接手机的高带宽连接,预计2年内相关手机芯片和卫星将投入使用。SpaceX预计在明年实现星舰(Starship)的完全可重复使用,并回收助推器和飞船,能够运载超过100吨到有用轨道。Elon Musk预计AI在明年(2026年)将比任何一个单独的人类更聪明,到2030年比所有人类的总和更聪明。Elon Musk相信在30年内,或者大约10-15个火星转移窗口后,火星可以实现自给自足。中国AI产业规模预计在2029年突破1万亿,未来五年复合增长率32.1%。AI Agent将向通用场景演进,实现“决策-执行-反思”的自主闭环能力。物理AI将成为下一代AI竞争高地,推动人工智能从虚拟助手向实体协作伙伴演进。AI将作为造福人类的国际公共产品,推动普惠共享。

关键人物与实体

政府及国际组织

  • 中共中央总书记、国家主席、中央军委主席习近平: 在2025年2月出席民营企业座谈会并发表重要讲话,强调人工智能产业的战略地位,指出中国高度重视人工智能发展,积极推动互联网、大数据、人工智能和实体经济深度融合。
  • 国务院: 发布《新一代人工智能发展规划》(2017年7月),制定人工智能发展战略目标;发布《关于深入实施“人工智能+”行动的意见》(2025年8月21日),部署全面推动人工智能与经济社会各行业各领域深度融合。
  • 国家网信办、国家发展改革委、教育部、科技部、工业和信息化部、公安部、广电总局: 共同发布并监管《生成式人工智能服务管理暂行办法》(2023年7月13日发布,8月15日施行),对AIGC服务进行规范。
  • 国家卫生计生委: 2017年2月修订“限制临床应用”医疗技术管理规范,其中包括人工智能辅助诊断。
  • 中国国家食品药品监督管理总局 (CFDA): 负责医疗器械审评审批,将决策支持、辅助诊断的医用软件列为Ⅲ类医疗器械,并制定相关技术指导原则和规范。
  • 美国食品药品监督管理局 (FDA): 1998年开始建立监管计算机辅助识别系统,2012年公布审查机器学习算法软件的指标,2017年成立专门致力于数字化医疗和AI技术审评的新部门。
  • 联合国: 在2016年的人工智能政策报告中探讨了自动化机器人、机械伦理、责任分担和决策可追溯性等挑战。
  • 美国白宫科技政策办公室: 2016年发布《为人工智能的未来做好准备》、《国家人工智能研究和发展战略计划》和《人工智能、自动化与经济报告》。
  • 英国下议院的科学和技术委员会: 2016年发布《机器人技术和人工智能》报告,规范机器人技术与人工智能系统发展。

企业与机构

  • iResearch (艾瑞咨询): 本报告的制作方,提供中国人工智能产业研究报告,具有六年行业研究经验。
  • DeepSeek (深度求索): 成立于2023年,由幻方量化创始人梁文锋创立。专注于大模型底层技术研发,其通用模型V系列、推理模型R系列以及代码模型、数学推理模型和多模态模型等达到业界领先水平。2025年初开源模型引起热潮,冲击西方软件盈利模式。
  • OpenAI: 大模型领域的领先者。2018年发布GPT-1,2022年11月发布ChatGPT引爆大模型时代。2024年2月发布Sora视频生成模型。2024年5月发布GPT 4o系列,具备端到端语音架构和多模态交互能力。2025年2月推出GPT 4.5系列模型。
  • Tesla (特斯拉): 由Elon Musk领导的电动汽车和AI公司。正在开发人形机器人Optimus和AI芯片(Dojo用于训练,AI for it用于推理,AI5是下一代推理芯片)。
  • SpaceX: 由Elon Musk创立的航天公司。致力于开发完全可重复使用的轨道火箭Starship,并计划实现卫星直接连接手机的Starlink网络。
  • xAI: Elon Musk创立的AI初创公司,已收购X。正在开发AI模型Grock。
  • Google (谷歌): 大模型Gemini的开发者。2017年提出Transformer架构。2018年发布BERT大模型。2016年成立DeepMind Health部门。
  • NVIDIA (英伟达): AI芯片市场的领导者,通过Blackwell架构GPU和CUDA-X生态几乎垄断全球90%以上的AI训练芯片市场。2025年初DeepSeek开源模型的发布导致其股价下跌。
  • 阿里巴巴 (Alibaba): 中国AI巨头。其“通义千问Qwen”大模型开源。拥有城市大脑项目。阿里云在2024年5月宣布通义千问最高降价97%。阿里邮箱在AI技术加持下提升企业服务能力。阿里云在2025年8月领投了自变量机器人完成10亿元A+轮融资。
  • 字节跳动 (ByteDance): 中国AI巨头。其“豆包”大模型开源。2024年5月将其大模型计价单位从分降至厘。拥有火山方舟大模型开发平台和扣子、HiAgent智能体开发平台。2024年10月推出首款AI智能体耳机Ola Friend。其视频剪辑平台剪映融合AI技术。猫箱是其内部团队Flow开发的AI情绪陪伴产品。
  • 百度 (Baidu): 中国AI巨头。拥有自动驾驶平台Apollo、百度医疗大脑。2024年5月宣布两款主力大模型免费。
  • Anthropic: Claude模型的开发者。2024年6月发布Claude-3.5-Sonnet模型,在编程能力上取得重大突破。2024年11月发布MCP(模型上下文协议)。
  • 科大讯飞: 中国智能语音技术领先者。2015年开始布局AI+医疗,开发智医助理、语音电子病历、影像辅助诊断系统和人工智能辅助诊疗平台。2024年8月更新星火语音大模型,采用端到端语音架构。
  • 月之暗面 (MiniMax): 中国大模型初创企业,其Kimi智能助手以长文本分析见长。2024年8月发布企业级API加码B端。星野是其旗下的AI情绪陪伴产品。
  • 智谱AI (Zhipu AI): 中国大模型初创企业,其ChatGLM大模型开源。2024年10月推出自主智能体AutoGLM。
  • 上海稀宇科技 (MiniMax): 中国大模型初创企业。
  • Stability AI: 2024年6月正式开源Stable Diffusion 3,采用DiT架构。在音乐生成领域开源Stable Audio 2.0和Open等系列。
  • ElevenLabs: 海外AI音频模型公司。2022年成立,提供多种语言的逼真语音、声音和音效生成,2024年10月发布AI语音生成工具Voice Design。
  • Suno AI: 美国AI音乐创作公司。2022年成立,基于Chirp模型生成逼真音乐和声音效果。
  • 蝴蝶效应: 2025年3月推出通用型AI助手Manus,实现企业研究、旅行规划、课程设计等多场景任务规划与流程操作。
  • 幻方量化: DeepSeek的创始人梁文锋曾是其创始人。
  • Momenta: 2017年ImageNet挑战赛中,利用SENet架构取得第一,将错误率降至2.251%。
  • IT桔子: 创投数据服务商,发布《2024年中美独角兽公司发展分析报告》。
  • Gartner (高德纳): 技术咨询机构,预测到2025年,AI生产的数据将占所有数据的10%,超过30%的药物和材料将通过生成式人工智能被发现。
  • Acumen Research and Consulting: 国外商业咨询机构,预测2023年全球AIGC市场规模有望达到1100亿美元。
  • PwC (普华永道中国): 提供AI监管新时代风险提示及应对措施的咨询服务。
  • Gong.io: 美国估值最高的AI基础设施独角兽,达到72.5亿美元。
  • ESWIN (奕斯伟): 中国估值最高的AI基础设施独角兽,估值不到50亿美元。
  • 黑芝麻智能、摩尔线程、旷视科技: 中国估值超过40亿美元的AI芯片独角兽。
  • Nuro: 美国自动驾驶独角兽,估值约90亿美元。
  • 地平线、小马智行: 中国自动驾驶独角兽,估值分别为87.1亿美元和85亿美元。
  • 姚班、清华: 培养了月之暗面等大模型初创企业的创始人。
  • 华为、荣耀、小米、VIVO、OPPO: 国产手机厂商,纷纷打造手机端侧大模型。
  • Remini: 以粘土风出圈的AI图片编辑产品。
  • 美图: 旗下有美图秀秀、WHEE、Wink、美图工作室等产品,融合AI技术提供编辑和生成功能。
  • 快手: 旗下有视频生成类产品“可灵AI”。
  • 出门问问: 旗下有魔音工坊(文字转语音生成产品)。
  • 昆仑万维: 旗下有音乐生成平台SkyMusic。
  • 恒图科技: 图像编辑厂商,积极出海。
  • Monica.AI: 以插件工具切入市场的出海创企。
  • Crushon.AI: 以NSFW(Not Safe For Work)切入市场的出海创企。
  • Zendesk: 海外CRM厂商,2024年9月推出基于结果的定价模型。
  • Sierra: AI客服创企,采用“效果计费模式”。
  • 沐曦、天数智芯: 基础层企业,接入DeepSeek生态。
  • 钉钉、吉利汽车: 应用层企业,接入DeepSeek生态。

个人

  • 约翰·麦卡锡 (John McCarthy): 人工智能的命名者。
  • 诺伯特·维纳 (Norbert Wiener): 控制论之父。
  • 斯图亚特·罗素 (Stuart Russell) 和 彼得·诺维格 (Peter Norvig): 《人工智能:一种现代的方法》一书的作者,对人工智能进行定义。
  • 李开复 (Kai-Fu Lee): 创新工场创始人,学者,认为人类将在很长一段时间处于弱人工智能层级。
  • 奥伦·伊兹奥尼 (Oren Etzioni): 学者,认为人类将在很长一段时间处于弱人工智能层级。
  • 蒋璐伊、王贤吉、金春林: 《人工智能在医疗领域的应用和准入》一文的作者。
  • 陶晓东: 科大讯飞医疗CEO。
  • 梁文锋: 幻方量化创始人,DeepSeek公司创始人。
  • Alex Karp: 在会议上捍卫西方价值观的演讲者。
  • Danny Forester: 纪录片《Future Made in China》的主持人,探索中国创新。
  • Eric Pong: 深圳的年轻企业家,展示如何快速制造定制手机。
  • Jason: Makeblock的创始人,发明了机器人建造工具包。
  • Vega Wang: 中国时尚设计师,在国际上享有盛誉,其设计融入了中国本土文化元素。
  • 韩曦: 阿里巴巴副总裁,在2025年9月11日表示AI正成为电商新基建。
  • Nikki Bryzy: 被提及但未提供详细信息。
  • Bunning Grom Imagine: 被Elon Musk提及,但未提供详细信息。
  • Douglas Adams: 《银河系漫游指南》的作者,被Elon Musk认为是“哲学之书”。

概念与技术

  • AGI (人工通用智能): 人工智能研究的终极目标。
  • Scaling Law: 大模型性能提升与计算量、参数量、数据大小的关系。
  • Transformer架构: 基于自注意力机制的神经网络结构,奠定大模型基础。
  • Diffusion Model (扩散模型): 基于概率生成的深度学习模型,在图像生成领域广泛应用。
  • DiT (Diffusion Transformer): 融入Transformer架构的扩散模型,显著提升图像生成质量。
  • MLLM (多模态大语言模型): 能够处理和理解多种不同类型数据输入输出,实现跨模态理解和生成任务。
  • CoT (思维链, Chain of Thoughts): 优化模型推理能力的后训练技术。
  • 强化学习 (Reinforcement Learning): 通过奖惩机制优化模型行为的学习方法。
  • MoE (混合专家架构): 通过多个专家网络协同工作,提高模型的多样性和效率。
  • MLA (多头潜在注意力机制): 优化KV缓存使用,提高推理效率。
  • MTP (多token预测): 一次预测多个token,提升训练和推理效率。
  • FP8 (混合精度框架): 将部分参数压缩到FP8,在资源有限情况下保证模型质量。
  • LLMOps: 面向大模型,提供整个模型生命周期中加速AI模型开发、部署和管理的专业平台工具。
  • AI Agent (智能体): 能够自主感知环境、作出决策并执行行动的智能体产品。
  • 物理AI (Physical AI) / 具身智能: 融合数字智能与物理世界的桥梁,具备多模态感知与具身行动能力的智能系统。
  • ASR (语音识别): 将语音信号转换为文本。
  • TTS (语音合成): 将文本转换为自然逼真的语音。
  • RAG (Retrieval-Augmented Generation,检索增强生成): 通过外部知识库增强大模型生成能力。
  • MCP (模型上下文协议): 推动大模型与外部数据源、工具和服务进行高效标准化连接的工具协议。
  • 自变量机器人: 一家完成10亿元A+轮融资的机器人公司,阿里云领投。
  • 星源智机器人: 完成两亿元天使轮融资的机器人公司,智元下注。
  • Makeblock: Jason创立的机器人建造平台,提供机械零件、电子模块和软件。
  • WeChat (微信): 中国领先的移动社交媒体平台,拥有大量活跃用户,其创新改变了中国人的交流方式。
  • FAST (天眼): 世界最大单口径射电望远镜,位于中国贵州平塘。、

 

2024年中国人工智能产业研究报告 - 详细简报

发布机构: iResearch(艾瑞咨询) 发布日期: 2025年(报告标题提及“2024年中国人工智能产业研究报告”,但报告内文及版权信息均为2025年,推测报告发布时间为2025年初,回顾2024年并展望未来。)

前言

本报告深入探讨了2024年中国人工智能产业的发展环境、产业进程及产品动态,聚焦技术驱动、产业机遇、商业模式及挑战等核心议题。报告通过资深专家访谈、桌面研究、案例实证、行业对比及投融资数据统计等方法,提供了前瞻性数据与深度洞察。

摘要

2024年,中国人工智能产业在国家战略高度重视、政策大力支持下持续发展。尽管GDP增速放缓,AI技术作为新质生产力展现出广阔前景。资本市场聚焦语言与多模态模型应用、芯片、算力服务等领域。生成式AI普及加速了市场教育,但就业替代和隐私安全等问题也引发担忧。技术方面,Transformer架构主导大模型发展,强化学习和思维链优化提升推理能力,跨模态融合加速,推理效率优化和新型注意力机制持续探索。

主要主题与重要事实/观点

1. 宏观环境与政策支持

  • 国家战略地位: 2024年,人工智能被中央及各地政府确立为重点发展方向,出台了一系列政策措施,旨在推动产业创新,提升区域经济竞争力。习近平总书记强调民营企业在人工智能产业中的关键角色与战略地位。
  • 地方政府积极响应: 以北京、上海为代表,成都、重庆、安徽、山东、深圳、湖南等地政府将人工智能纳入当地发展规划,助力产业生态形成。例如,北京市政府加大科研投入、建设算力基础设施、吸引顶尖人才企业;上海市政府则侧重产业集聚和生态建设,推动AI在金融、制造、生物医药等领域应用,并促进AI开源生态发展。
  • 高维规范建设: 国家层面正积极进行人工智能产业的规范建设,包括数据要素、信息化标准、人工智能安全治理框架和人工智能产业综合标准化体系建设。例如,2024年1月十七部门印发《“数据要素×”三年行动计划(2024—2026年)》,2024年9月全国网络安全标准化技术委员会发布《人工智能安全治理框架》1.0版。
  • “人工智能+”行动: 国务院于2025年8月26日发布《关于深入实施“人工智能+”行动的意见》,旨在推动AI与经济社会各行业各领域深度融合,重塑生产生活范式,加速培育新质生产力。目标到2027年实现AI与6大重点领域广泛深度融合,智能终端普及率超70%;到2030年普及率超90%,智能经济成为重要增长极;到2035年全面步入智能经济社会新阶段。
  • 重点行动领域: 涵盖科学技术(加速科学发现、创新研发模式)、产业发展(培育新模式新业态、工业/农业/服务业智能化)、消费提质(拓展服务消费、培育产品消费)、民生福祉(智能工作、高效学习、品质生活)、治理能力(社会治理、安全治理、生态治理)以及全球合作。

2. 产业发展与市场规模

  • 市场规模增速略低于预期: 2024年中国AI产业规模为2697亿元,增速26.2%,略低于预期。主要原因是大模型在实际业务场景表现未完全满足客户需求,且建设成本较高,多数项目仍处于探索阶段。
  • 未来增长预测: 艾瑞咨询预测2025年至2029年中国AI产业将保持32.1%的年均复合增长率,在2029年突破1万亿的市场规模。
  • DeepSeek的推动作用: 2025年初,以DeepSeek为代表的国产开源大模型掀起热潮,其高性能、低成本的特点加速了中国AI生态的开放性和竞争力提升,带动了模型层的国产化创新和应用层的创新活力。DeepSeek的开源策略结合高效、低成本的架构显著加速了中国AI产业向更加高效、开放和自主的方向迈进,并带动产业链上下游的合作与应用落地。
  • 资本市场关注点: 投资重点聚焦于语言与多模态模型应用、芯片、算力服务等领域。2024年,语言及多模态赛道最受瞩目,基础层投融资显著上升,其中AI芯片产品投资占比约50%。
  • 商业模式: 商业化以项目制与订阅制为主流。政企客户以项目制为主,C端产品多采用“免费+订阅制”。新兴商业模式为按应用效果或功能点收费,以降低客户采购决策成本并倒逼供应商优化产品技术与服务。
  • 全球化战略: 面对国内激烈竞争,众多企业积极出海,在图像、视频和社交等领域取得突破。出海背景包括海外更广阔市场、成熟付费习惯、较低竞争、语言文化壁垒降低以及部分市场监管宽松。挑战包括文化差异、对中国品牌信任度、数据跨境隐私和合法合规。

3. 技术发展与趋势

  • Transformer架构主导: Transformer架构已奠定当今大模型架构基础,并更多融入语音、视觉领域,发展端到端的语音大模型、以DiT、ViT为代表的视觉大模型。
  • Scaling Law与优化: Scaling Law(模型参数、计算量、数据量增加提升性能但效果递减)仍在大模型发展中被探索。头部厂商通过加大投入延续“大力出奇迹”路径,但也转向多途技术路径,如后训练的思维链优化和强化学习,将Scaling方法从预训练转移到推理优化阶段,为大模型能力扩展提供新道路。
  • 思维链(CoT)优化: 强化学习完成推理侧优化,通过学习更好地应用内部思维链,提升模型在解决复杂问题(如复杂计算、科学研究)时的表现。DeepSeek R1系列推理思考模型的开源开放,极大推动了全产业推理思考模型的技术进步。
  • 跨模态融合: 将大语言模型、视觉理解模型及视觉生成模型等能力实现高阶融合。OpenAI的GPT-4o模型在文本、语音、图像等多维度实现高效交互,支持灵活的双工交互。未来在直接视频分析及交互领域是新的突破方向。
  • 算力需求结构性转变: 2024年部分地区智算中心出现闲置,主要是供需错配。随着DeepSeek等开源模型推动推理应用爆发,推理侧算力需求大幅上涨,智算中心利用率有望逐步提高。DeepSeek通过算法优化(如结构化稀疏注意力、混合专家系统)显著降低了模型训练成本,在一定程度上削弱了美国通过芯片出口管制遏制中国AI发展的国际战略。
  • 工具生态日益完善: 分布式AI框架(DeepSpeed, Megatron, Colossal-AI)、LLMOps平台和一体机产品不断发展,深度融合软硬件优势,加速了大模型的训练与部署,有效支撑了产业侧大模型的应用建设。DeepSeek适配一体机市场预计在2025年升温。
  • AI Agent重塑产品形态: AI Agent正在重塑大模型的产品应用形态,带领AI产品由简单的对话问答向完成复杂任务的智能代理演进。Agent作为“桥梁”,弥合大模型能力与场景应用的鸿沟,支撑大模型落地到各类具体应用。目前市场呈现厂商生态分化态势,互联网科技巨头、垂直领域科技厂商、Agent开发平台厂商和原生Agent应用厂商各有侧重。
  • 物理AI(具身智能): 作为连接数字智能与物理世界的关键技术,具身智能是下一代AI竞争的战略高地。其发展需要解决硬件加速和软件优化、跨行业生态协作等挑战。目前已在机器人动作表现、工业机器操控等场景初步体现,未来有望在老年陪护、家庭管家等场景发挥作用。
  • AI硬件: AI能力输入到终端硬件,端侧AI寻求规模效应突破,承载更多流量入口。AI手机、AI电脑成为主力卖点,AI学习机、AI智能体耳机等创新硬件涌现。未来新颖的硬件设备(如Rabbit R1、AI Pin)有望打开用户新需求新场景。

4. 社会影响与挑战

  • 公众认知度提升: 生成式AI的普及加速了市场教育,公众接受度显著提升。2022年11月ChatGPT的发布被27.2%的人认为是“AI到来的标志事件”。文本写作和图片生成是主要尝试的AI功能方向。
  • 焦虑情绪加重: 超过半数的人认为“AI产品及服务让我更加焦虑”。AI技术对重复性、规律性强的工作岗位(如数据分析员、财务法律专员、客户服务)带来威胁,可能被数字员工、AI Agent取代。对AI越了解的人,负面情绪占比越高。
  • 安全与隐私问题: AI的广泛应用引发隐私安全担忧,包括就业替代、虚假信息传播、网络攻击、诈骗事件和恐怖活动等恶意利用的风险。构建面向新一代人工智能的安全治理体系至关重要,需在技术、商业、法律、伦理等多个层面协同发力。
  • 主要安全问题: 包括内生安全(数据安全风险如数据隐私、提示注入、模型投毒;算法安全风险如可解释性缺陷、算法偏见、模型幻觉)和应用安全(内容安全风险如虚假信息传播、信息茧房加剧、违法犯罪滥用;责任归属风险、情感伦理风险)。
  • 中国AI与西方AI的竞争格局: 《经济学人》指出美国在私营部门创新、前沿研究(AGI)、模型开发、投资和先进计算基础设施方面领先。中国在AI+大规模部署(农业、制造业、监控)、专利总量上领先,尤其在计算机视觉和自然语言处理的应用层专利优势明显。
  • 中国“开源战略”: 中国通过免费开源高性能模型(如通义千问Qwen、DeepSeek、豆包、ChatGLM等)冲击西方软件收费模式,将其AI大模型从“奢侈品服务”变为“公共基础设施”,以期瓦解西方盈利根基。
  • 硬件“控局”: 开源降低AI使用门槛后,全球开发者和企业需要强大硬件运行这些模型。中国庞大的制造业生态和快速迭代能力,使其能提供与开源模型适配最好、成本最低、品类最全的硬件矩阵,形成“生态锁定”和“成本锁定”。这被视为“软硬件的解耦与再耦合”,最优解是“中国的脑”配上“中国的身”。
  • 时代逆转: 传统“硬件商品化,软件为王”的逻辑在AI时代被逆转为“硬件稀缺性超越软件”。软件因开源趋于“富余化”,而高端芯片制造、具身智能硬件的大规模低成本制造能力成为稀缺资源和战略壁垒。

5. 行业应用实践

  • B端大模型商业化: 央国企为需求主力,率先落地在政务、教科、通信、能源等领域。2024年大模型项目数量和金额快速增长,科大讯飞、百度、智谱、火山引擎、阿里云和腾讯云等为主要中标厂商。DeepSeek开源模型发布,进一步掀起B端产业生态合作浪潮。
  • C端AI产品: 涵盖内容创作、智能对话、情感陪伴、效率工具及音视频生成等。商业模式主要采取“免费+订阅制”。目前仍面临用户黏性不足、收费持续性不足的问题,产品形态尚未稳定,生态壁垒尚未建立。
  • AI Coding: 利用AI技术自动生成代码的工具,提升编码效率、减少人为错误、简化开发流程。受益于思维链优化和强化学习,AI Coding产品正从辅助性Copilot向自主性Agent演进,有望降低编程门槛,推动编程民主化。
  • 医疗领域的应用: 人工智能在医疗领域有9大类应用,包括虚拟助手、疾病诊断与预测、医疗影像、病历/文献分析、医院管理、智能器械、新药研发、健康管理和基因。国内医疗影像领域企业涉足最多,因深度学习在图像识别突破、医疗影像数据丰富、商业化较快及国内研发能力相对较弱等原因。
  • 挑战: 数据隐私、数据标准、医保支付、责任风险。我国医疗数据标准化低,共享机制不健全。
  • 准入管理: 美国FDA已成立专门致力于数字化医疗和AI技术审评的新部门,并出台《21世纪治愈法案》等加快审批流程。我国也已出台相关政策,但尚未有专职管理部门。

6. 标杆案例

  • 字节跳动: 构建了以自研豆包系列大模型为基础,火山方舟大模型开发平台和扣子/HiAgent智能体开发平台为支撑,顶层应用种类丰富的AI产品矩阵。豆包作为多模态AI助手,深度整合了字节跳动技术与行业资源,功能涵盖文案创作、PDF问答、长文本分析、图像生成、信息搜索等。
  • 阿里邮箱: 将AI能力深度融入企业邮箱业务,通过多种大模型接入(通义千问、DeepSeek等),实现邮件文本处理、场景邮件流转、三方应用接入等自动化功能,将邮箱数据格式化为自动化工作流的“元数据”,解决企业业务问题,提升效率和管理水平。
  • DeepSeek(深度求索): 成立于2023年,专注于大模型底层技术研发。已推出通用模型V系列、推理模型R系列、代码模型、数学推理模型和多模态模型等多款开源模型。其V3模型实现轻量化部署,R1推理模型性能比肩OpenAI o1正式版。DeepSeek坚持开源策略,通过工程优化(如MoE架构、多头潜在注意力MLA、多token预测MTP、混合精度框架FP8)和算法创新(如GRPO强化学习),突破性能与成本瓶颈,推动技术普惠与平权,加速大模型向产业端和消费端渗透。

结论

2024年中国人工智能产业在政策大力支持、技术持续创新和应用场景拓展下快速发展,尽管市场规模增速略低于预期,但未来增长潜力巨大。DeepSeek等国产开源大模型的崛起,不仅推动了技术普惠和国产化,也正在重塑全球AI竞争格局。中国正利用“开源+硬件”的战略,试图瓦解西方软件盈利模式,并掌控AI核心硬件制造与供应链,将竞争焦点转向稀缺硬件和全球生态主导权。同时,社会对AI的接受度提高,但也伴随着对就业、隐私和安全的担忧,需要构建健全的治理体系。AI Agent、物理AI和AI硬件等新兴领域预示着未来AI更深层次的变革和更广泛的应用。

 

 

中国人工智能:产业洞察与未来展望

 

1. 2024年中国人工智能产业的市场规模和增长情况如何?

2024年中国人工智能产业规模达到2697亿元,同比增长26.2%,略低于预期。主要原因是大型模型在实际业务场景中的表现未能完全满足客户需求,且建设成本较高,许多项目仍处于探索阶段。然而,随着DeepSeek等开源模型的兴起,以及AI Agent等智能体产品实用性的提升,预计从2025年到2029年,中国AI产业将保持32.1%的年均复合增长率,并在2029年突破1万亿的市场规模。

2. 中国在推动人工智能发展方面有哪些关键政策和战略?

中国政府高度重视人工智能发展,将其纳入国家战略。中央和地方政府出台了一系列政策措施,旨在推动产业创新、提升区域科技竞争力。例如,北京和上海等城市积极加大科研投入、建设算力基础设施、打造产业创新高地。2025年8月,国务院发布了《关于深入实施“人工智能+”行动的意见》,明确了到2027年和2030年人工智能与各领域深度融合的目标,并提出了“人工智能+”科学技术、产业发展、消费提质、民生福祉、治理能力和全球合作等六大重点行动,旨在全面赋能高质量发展。

3. 中国人工智能产业在技术发展方面有哪些亮点和挑战?

技术方面,Transformer架构仍然主导着大型模型的发展,研发通过强化学习、思维链优化等方式提升模型推理能力,并加速跨模态融合。DeepSeek等国产开源大模型的崛起,以其高性能、低成本的特点,推动了中国AI生态的开放性和竞争力。然而,大型模型在实际业务场景中的表现和高昂的建设成本仍是挑战。同时,AI Agent和具身智能作为下一代AI竞争的战略高地,其发展需要解决硬件加速、软件优化和跨行业生态协作等一系列挑战。

4. DeepSeek在推动中国人工智能产业发展中扮演了怎样的角色?

DeepSeek在2025年初掀起了国产开源大模型的热潮,其高性能、低成本的特点迅速吸引了国内外开发者和企业的关注。DeepSeek的开源策略结合高效、低成本的架构,显著加速了中国AI产业向更高效、开放和自主的方向迈进,并带动了产业链上下游的合作与应用落地。它刷新了市场对大模型现阶段性能的认知,降低了中小企业和个人获取AI工具的门槛,激发了应用层的创新活力,成为中国AI产业发展的标志性事件。

5. 中国人工智能产业的商业模式和市场竞争格局是怎样的?

目前,中国AI产业的商业化以项目制和订阅制为主流。政企客户主要采用项目制,而C端产品多采用“免费+订阅制”模式。新兴的商业模式包括按应用效果或功能点收费,这有助于降低客户采购决策成本,并促使供应商持续优化产品技术与服务。在市场竞争方面,大型模型厂商之间竞争激烈,纷纷采取降价策略以争夺市场份额。同时,AI Agent和AI Coding等新产品形态正在重塑大模型的应用,推动AI产品从简单的对话问答向完成复杂任务的智能代理演进。

6. 人工智能在医疗领域有哪些具体的应用,以及面临哪些挑战?

人工智能在医疗领域有广泛应用,主要包括虚拟助手、疾病诊断与预测、医疗影像、病历/文献分析、医院管理、智能器械、新药研发、健康管理和基因等九大类。然而,医疗AI的发展也面临诸多挑战,如数据隐私、数据标准化、医保支付、责任风险以及法律监管缺失等问题。尽管深度学习在图像识别方面取得突破,使医疗影像成为国内AI医疗企业布局最集中的领域,但整体而言,医疗数据的整合和标准化工作仍未完成。

7. 中国在人工智能领域的全球竞争策略是什么?

中国在人工智能领域的全球竞争策略可以概括为“开源+硬件”模式,旨在从根本上瓦解西方AI的商业模式并争夺全球科技价值链的主导权。通过免费开源高性能AI模型,中国降低了全球开发和使用AI的门槛,冲击了西方昂贵的API调用和软件授权模式。同时,依托庞大的制造业生态和快速迭代能力,中国能够提供与开源模型适配最好、成本最低、品类最全的AI芯片、服务器、机器人等核心硬件,形成“中国的脑”配“中国的身”的“生态锁定”和“成本锁定”,尤其是在“一带一路”沿线的发展中国家市场。

8. 公众对人工智能的态度如何?有哪些担忧?

生成式AI的普及加速了市场教育,公众对AI的接受度显著提升。ChatGPT的发布被认为是“AI时代到来”的标志性事件,文本写作和图片生成成为大家主要尝试的AI功能。然而,人们对AI也存在一定的焦虑和不安情绪,超过半数的人认为“AI产品及服务让我更加焦虑”。这种担忧主要源于对就业替代(特别是重复性、规律性强的工作岗位)、隐私安全(如AI换脸诈骗)以及大模型可能被恶意利用(如制造虚假信息、网络攻击)等问题的考量。了解AI越深的人,负面情绪的占比也越高。