近日,昆仑万维在北京举行AIGC技术发布会,会上昆仑万维CEO方汉正式发布了昆仑天工AIGC全系列算法与模型,并宣布模型开源。
“昆仑天工之所以选择开源,因为我们坚信开源是推动AIGC生态发展的土壤和重要力量。昆仑万维致力于在AIGC模型算法方面的技术创新和开拓,致力于推进开源AIGC算法和模型社区的发展壮大,致力于降低AIGC技术在各行各业的使用和学习门槛。”方汉介绍说,把技术开源是一个非常好的把握Web3时代机遇的方法。开源的迭代速度远远超过闭源,能够极大的促进行业生态发展。同时还可以加速全球化,让更多海外公司和用户参与开源社区的建设中,这样就极大推动了中国公司全球化的进程。
众所周知,AI大模型的研发,需要高素质的技术团队和大笔的研发投入。而昆仑万维从2020年开始布局AIGC,研发人员200余人,由多位行业资深专家领衔,由昆仑万维CEO方汉亲自带队,训练集群200张卡,投入数千万元。2020年底至2021年4月份研发出百亿参数的中文GPT-3模型,并于2021年8月开始研发基于自有大文本模型的对话机器人,迅速刷新国内技术指标;2022年1月启动SkyMusic音乐实验室,2022年4月达到人工智能领域最优效果;2022年9月份启动编程、图像、文本方向的AIGC产品。
据悉,昆仑天工旗下模型包括天工巧绘SkyPaint、天工乐府SkyMusic、天工妙笔SkyText、天工智码SkyCode,覆盖图像、音乐、文本、编程等多模态内容生成能力。目前,AI图像、AI文本、AI编程的模型已经在GitHub上开源。昆仑天工的发布,标志着昆仑万维成为目前国内AIGC领域布局最为全面的公司之一,也是国内第一个全身心投入到AIGC开源社区的公司。
昆仑万维的投入和重视程度,让昆仑天工在各方面性能上能够脱颖而出。如今昆仑天工的AI大模型能够拥有多样的任务能力,包括续写、对话、中英翻译、内容风格生成、推理、诗词对联等。当前,在各项专业性领域的任务中,如分类、匹配、填空、识别等,昆仑天工的表现突出,与现有中文大模型的对比,也能够排列前茅。
在图像生成方面,昆仑天工的AI图像模型天工巧绘SkyPaint,是全球第一款多语言Stable Diffusion分支模型,从底层上就能够同时支持中英文双语,而行业大部分竞品只能单独支持英文或者中文。
图1 昆仑天工AI绘画作品
在AI作曲方面,天工乐府SkyMusic作为国内第一款商用级作曲AI模型,StarX MusicX Lab 音乐实验室目前面向全球音乐市场,已在美国、韩国、印尼等国家及全球180多个音视频平台发行了近20首人工智能生成歌曲,生态合作伙伴遍布汽车、教育、时尚、游戏、娱乐、政府等不同机构和团体。
在文本生成方面,天工妙笔SkyText针对中文领域构建了千亿级的高质量数据集,基于超高性能训练集群,生成了百亿级参数的GPT-3模型。模型拥有多样化的下游能力,包括续写、对话、中英翻译、内容风格生成、推理、诗词对联等,并在各项专业性领域的任务中(例如分类,匹配,填空,识别)表现突出,在与竞品的比试中名列前茅。
在AI编程方面,天工智码SkyCode是全球第一款多语言开源编程大模型,能够支持多种主流编程语言如Java、JavaScript、C、C++、Python、Go的自动生成,支持代码的续写,包括根据代码注释写代码(解题)等。
目前,昆仑万维在全球平均月活跃用户近4亿,并且已然涉猎的多元业务覆盖AIGC多个重要场景。昆仑天工也将全面激活昆仑万维内部多元业务的“神经系统”,提升元宇宙、文娱、社交等业务版块的内容生成能力,助推内部业务的动能切换,让昆仑万维更有余力建造更为复杂多元的内容生态。