大模型的“神秘面纱”正逐渐被掀开。
作为国内云市场的巨头,阿里云近日宣布开源通义千问两款70亿参数通用模型,名为Qwen-7B和Qwen-7B-Chat。而在上个月18号晚,Meta表示发布开源大模型Llama2,为初创企业和其他企业提供体格强大的免费选择。
(资料图片)
根据财经网科技不完全统计,2023年发布的开源模型已超25个。在大模型竞争激烈的环境下,各家厂商竞相探索自家的商业模式和发展战略,以求在行业中保持领先地位。
天使投资人、知名互联网专家郭涛表示:“Meta和阿里云等大厂通过大模型开源方式,可以迅速完成大模型产品的用户积累、数据沉淀和应用生态的构建,持续推动技术迭代升级和应用落地,从而建立企业的竞争壁垒。”
大模型走向开源
毋庸置疑,当前科技圈已步入“大模型”时代。从去年12月ChatGPT的浪潮席卷全球以来,几乎所有的科技企业都想抓住这个机会。先有百度文言一心、阿里通义千问等厂商陆续推出大模型,后有科技圈曾经的风云人物,王慧文、王小川、李开复等人陆续入场。半年时间内,大模型行业阵阵喧嚣。
而经过大半年的沸腾后,大模型行业出现了一股新的浪潮:从闭源到开源。曾经,巨头科技公司在AI领域真金白银的投入研发,并通过专利和版权法律保护他们的产品。然而,这一传统正在被AI大模型逐渐改变。
Llama2全面开源后,越来越多的开发者开始投入Meta以及各种开源模型的阵营。8月初,阿里云宣布通义千问70亿参数通用模型和对话模型加入开源队伍,免费可商用。
想要下载阿里云开源模型的用户,可从魔搭社区直接下载模型,也可通过阿里云灵积平台访问和调用Qwen-7B和Qwen-7B-Chat,阿里云为用户提供包括模型训练、推理、部署、精调等在内的全方位服务。
不到一周后,前腾讯公司副总裁姚星打造的XVERSE-13B宣布开源。作为一个通用大模型,XVERSE-13B可提供文本生成、自动化写作、数据分析、知识问答、多语言翻译、个性化交互、人物角色扮演、专业小助手等多方面的生成服务,可在医疗、文旅、金融和娱乐等多个行业应用。
秉持开源精神,XVERSE-13B代码采用 Apache-2.0协议,向学术研究完全开源,企业只需简单登记,即可免费商用。中国科学院院士、CCF开源发展委员会主任王怀民在今年的中关村论坛上表示,开源实践已经推动一种面向服务的产业生态,形成了互联网时代基于众包的创新模式。一旦开源运用好,既能够支持创新,也能够有效地兼容商业领域的创业实践。
当前随着多个大模型走向开源,AI模型应用铺天盖地的出现,近期妙鸭相机的出现就是代表之一。但是在现有阶段,开源模型的发展还无法言完美。
开源模型的AB面
开源一词于1998年由Chris Peterson提出,目前关于开源的定义,业内共识是:开源是将源代码、设计文档或其他创作内容开放共享的一种技术开发和发行模式。在开源模式下,通过许可证的方式,使用者在遵守许可限制的条件下,可自由获取源代码等,并可使用、复制、修改和再发布。
对于用户而言,开源大模型无疑降低了使用门槛,让更多商业公司和研究机构开源免费使用。“全球科技创新的开源之路走到今天,大模型作为全球强人工智能领域的最新成果亦加入其中,更有后来者中资科企踊跃迈进,这当然是开源社区之福。”独立国际策略研究员陈佳肯定开源模型带来的价值外也坦言:“开源并不是包治百病,大模型本身更不是万灵药。”
他表示,开源问题并非简单的科技企业获取、使用、牟利并反馈社会的知识创造,近二十年来全球科技产业链大量数据显示,它在具体操作流程中会因不同的社会条件和商业环境衍生出差异化形态,对产业发展和科技创新体制机制的影响极其深远。
今日,公安部在北京召开新闻发布会,通报全国公安机关打击整治侵犯公民个人信息违法犯罪行为的举措成效。针对“AI换脸”导致群众被欺诈的问题,公安机关发起专项会战,截至目前,已侦破相关案件79起,抓获犯罪嫌疑人515名。
目前利用AI技术进行诈骗的常用手法主要有:声音合成、AI换脸、转发微信语音以及通过AI技术筛选受骗人群。根据工信部反诈专班内容显示,人脸效果更容易取得对方信任,骗子用AI技术换脸可以伪装成任何人,骗取信任后。
人脸识别技术与AI换脸已成为当下国家整治重点。8月8日,国家互联网信息办公室发布消息称,国家互联网信息办公室起草了《人脸识别技术应用安全管理规定(试行)(征求意见稿)》,提及在公共场所使用人脸识别技术,或者存储超过1万人人脸信息的人脸识别技术使用者,应当在30个工作日内向所属地市级以上网信部门备案。
陈佳向财经网科技表示,当前国内大模型市场底层技术研发仍存在瓶颈、科技伦理监管还没有完全到位,市场API开发工具应用乱象频发,AGI尚未发展AI诈骗却先行,这些问题单靠开源不仅不能解决,甚至还可能短期内激化。再加上当前全球范围内的反GPT滥用,反AIGC和大模型抢夺实体经济工作岗位的浪潮还在继续,短期内必须审慎做好大模型开源商用的顶层设计与微观配套。
公共利益与商业利益的平衡
开源风潮下,此前Falcon-40B的开源协议再次被拿出来讨论,关于开源大模型的商业化问题也同时抛出。“对商业化是有一定影响的。”盘古智库高级研究员江翰表示,一方面开源可以促进技术的发展和创新,推动商业化进程;而另一方面开源也可能导致竞争加剧,对商业化的利润产生影响。
不过在他看来,厂商可以通过多种方式来平衡公共利益和商业利益。例如选择合适的开源协议,确保商业利益不受侵犯;同时提供商业支持和咨询服务,满足客户的需求并获取商业回报。另外他以阿里云为例,表示其商用版和开源版模型定位不同,用于满足不同客户的不同需求。商用版通义千问参数更大、性能更高;开源版参数较小,训练、部署和推理成本更低,适合需要以较低成本、较快速度构建高质量模型的用户。
在陈佳眼中,公共利益和商业利益并非冲突性问题,“企业利用开源技术实现商业开发,为了确保商业利益排他性进而形成闭源品牌的盈利模式是无可厚非的,毕竟企业要生存发展,利润创造不仅是充分条件还是必要条件。同时开源社区技术领导者亦乐见其成,因为如此可以更加快速的推广所开源的技术进步。”
只不过在两者之间,他极力强调开源和商业化的良性互动关系必须创新,尤其是在商业开发战略上要更为开放才能实现赶超达到共荣。他以Meta采取主动建立Llama联合链的战略为例,阐释其Llama2本身作为生成式AI大模型和开发服务,再与微软公司Azure AI进行结合,对促进Windows桌面系统的移动化,以及与AGI深度结合拓展开发性有着不可估量的作用。
陈佳说,中资科企目前正处于追赶者的角色,要实现厚积薄发快速赶超,一方面一定要有国家战略持续扶持和精准施策,另一方面亦需要企业发挥主观能动性,真正下苦功提升独立自研能力,这是没有捷径可走的。
中国有最广大的技术社区与居民规模,有绵长雄厚的应用技术产业链和供应链,以及历经检验弹性韧性兼备的宏观经济,这些条件放在全球都是独一无二的。他直言:“开源战略确实能加速赶超,但其前提条件要求颇高,尤其是对实施开源的企业和平台的战略运维能力、财务运作能力、资源调度能力与风险控制能力都有极为现实和苛刻的要求。虽然任务繁重艰巨,但目前来看,开源之路很可能是中国打破西方技术垄断,实现科技自立自强的胜负手。”
关键词: