人工智能技术的不断创新正在为数字经济的发展注入强劲动力,相关产业成为国家现代化建设的重点领域。如何推动人工智能大模型与各行业深度融合,成为产业创新的关键抓手和新质生产力的驱动引擎,值得探讨。
ChatGPT和Sora等生成式人工智能产品刷新了人们对人工智能技术创新的认识。它们仿若人类般的表达方式和真实感十足的文生视频功能,颠覆了人们对人工智能尚处于探索初期的观念。这些产品反映了人工智能产业的基本趋势:以大模型为基础,实现人工智能技术的产业化落地应用。
大模型是指体量庞大、参数众多、计算能力强的机器学习模型,赋予人工智能产品接近人类思维的能力。过去,人工智能客服虽然冠以“人工智能”之名,但其功能仅限于根据用户输入的关键词触发对应的对话机制。如今,基于大模型的人工智能产品可以理解和识别用户的输入指令,提供个性化的回应。
人工智能产业也面临着技术创新困境。基于大模型的人工智能产品需要海量训练数据来支持算法模型的迭代和优化。这些训练数据不仅要达到千亿级规模,还需涵盖各行各业,并且信息内容完整、准确。满足这种训练数据需求不能仅仅通过抓取网络公开数据,因为可能涉及侵犯个人信息或其他企业的财产权。
海量训练数据需要计算机具备高效、准确的数据处理能力。这种计算能力与芯片等硬件设备密切相关,人工智能产业所需的算力芯片不是个人电脑中的CPU,而是更适合该产业的GPU芯片。算力资源的扩张不能仅仅通过频繁建设算力基础设施,因为同频计算会消耗大量电力,导致可用算力资源紧张。
为解决这些发展瓶颈,有关部门出台了多项地方性人工智能产业发展保障政策。更重要的是在国家层面明确体系化、系统性的产业发展指引,促进人工智能大模型更好地服务千行百业。
在训练数据供给方面,应探索适用于人工智能领域的公共数据训练平台,加快公共数据开放利用机制的落地。将人工智能产业训练数据需求的解决与数据要素市场化配置基础制度建设协同进行,在理清数据权益归属的基础上,释放数据要素对人工智能技术创新的加持作用。
在算力资源供给方面,可在全国统筹规划和整体布局关键算力基础设施的选址和建设,避免无序建设导致算力资源发展不平衡。算力互联互通是解决算力资源紧张的重要工具,通过整合公共算力、私人算力并进行统一调度,满足差异化的产业需求。
在算法模型创新方面,应着重推动自主研发基础算法模型。引导和支持科研人员深入探索大模型技术的实质性创新。
探索产、学、研协同创新研发机制,充分保障人工智能算法研发成果相关的知识产权。
有计划地培养人工智能算法研究的后备人才,引导和鼓励科研人员深入开展算法基础技术研究。
还没有评论,来说两句吧...