全球AIGC明星公司大盘点,作为局外人,你能看到谁会成为头号玩家

频道:AIGC 日期: 浏览:

在ChatGPT的影响下,今年的AIGC赛道依然火热。指用人工智能技术产生内容,AIGC又被视为UGC之后的、PGC之后的新的内容生产方式。

其流行原因是多方面的,在产生逼真图像的同时、视频及文本等功能,以更加有效的方式产生创意内容,AIGC办公,娱乐和医疗、在金融和其他方面有相当大的发展潜力,去年刚刚掀起的AIGC热潮,曾使许多业内人士以为是,会引发革命性的科技浪潮。

近年来生成式人工智能普及率稳步提升,并且这种趋势很可能会持续下去。理由是如前所述,数据与计算能力可用性越来越强,人对于更高的效率、更加高效地产生创意内容等要素,正促进生成型人工智能向纵深发展。

作为正在迅速成长中的一个领域,研究人员与工程师们正致力于促进该技术的发展,新突破层出不穷。由于AIGC目前的主要目标是通过学习数据分布的规律,进一步分解为图像,视频等、音频和其他产生,和自然语言的产生,例如,产生文本,或者象搜索引擎那样,以信息整合的方式提供谈话,答疑等。

除此之外,AIGC也可用作自动编码器,或在对抗学习的基础上,使机器学习产生类似于真实数据的样品,该技术还在图像中得到了广泛应用、音频与文本及其他方面。

现在已有许多企业在该技术的基础上作出了巨大的贡献,其中包括OpenAI,谷歌,NVIDIA,微软以及Facebook,在国内互联网公司里,百度推出中文版AI绘画工具“文心一格也”;阿里巴巴、京东这样一个数据庞大的大厂,也正在不断进入这个领域:

当然也有很多初创公司都在开发成型人工智能创新性应用,下面举例说明:

市场火爆使得a16z也不例外、梯度风险投资等、科斯拉风险投资公司、软银、红杉等著名投资机构相继入局。这些风险投资家对互联网创业企业有着怎样的判断?去年10月,Stable Diffusion背后的Stability AI宣布获得1.01亿美元来自Coatue和光速的投资,投资后,估值攀升至10亿美元。该项目是全球最大的人工智能软件研发中心之一,在算法方面取得重大突破,为智能驾驶汽车提供解决方案。有关方面的另外几家企业也得到了巨额资金支持,例如:

总体上看,这类企业的成功要素均具有一定的共性特征,包括获得海量高质量的数据、对人工智能、机器学习等领域有较强技术特长,及针对一系列产业及用例,开发出用户友好,高效应用的功能。另外还需要维持道德上的考虑以及负责任的技术应用,每个参与者所要关注的,就是长期价值。

|Open AI:呼声最高重量级运动员

ChatGPT在世界范围内炙手可热,将open AI打造成AIGC领域估值最高的企业。它的出现不仅为初创企业提供了融资渠道,也将人工智能技术与互联网相结合,创造出一种全新的商业模式。上溯到该公司的创建者,20岁时,山姆·阿尔特曼在斯坦福退学,开始创业,28岁晋升为YC孵化器总裁,37岁时,以ChatGPT在外人眼中拥有划时代意义。

自1月下旬以来,微软已经宣布了其在Open AI上的第三轮额外投资,金额或高达一百亿美元,Open AI身价已暴涨至290亿美元。这在过去一年多时间里,是业界最大的一个新闻事件,也成为了人们热议的话题之一。据悉推出五天ChatGPT,用户数则超过百万,2个月MAU超过1亿,同时还意味着服务器带宽成本较高。

微软为了在AI领域和Google、Meta和其他对手的争夺让Azure走上了前台,作为Open AI独家提供商,给予许多优惠待遇。但是即使如此Open AI还是没有赚钱。ChatGPT及其他AIGC产品正在免费公测中,目前,只有销售AI软件才能获得数千万美元收入。

简单的事例,微软对单个100 GPU的收费标准是3美元/小时,产生一个单词大约需要0.0003美元,摩根士丹利即使相信,ChatGPT回复一次可能要花2美分,约为谷歌搜索查询的平均费用的七倍。

在此背景下,Open AI迫切需要寻找一条商业化路径以获取利润,例如,最近官宣的ChatGPT Pro专业版本,价格将为每月42美元(约285人民币)。与此同时,微软计划把ChatGPT集成到其搜索引擎Bing上,Office产品还将逐步集成Open AI其他AIGC产品。

微软在OpenAI上的投入逻辑同样是非常易懂的,生成式AI中的巨额资本最终倾向于流入基础设施层,以是AWS,Azure、以GCP为主流云厂商,以及以英伟达为代表的GPU制造商。应用层厂商把约20%~40%的收益用于推理及模型微调。

根据A16Z的测算,这一部分收益一般会直接付给云厂商或者第三方模型提供商,第三方模型提供商还将把约半数收益投入到云基础设施中。所以,生成式AI总收入总体上有10%到20%是向云提供商转移。

据《财富》报道,当OpenAI首批投资者回收初始资本时,微软会有权赚取OpenAI 75%利润,直至收回投资成本;OpenAI盈利920亿美元时,微软所占比例将下降到49%。通俗地说就是OpenAI向微软出借了这家公司,借多借少,要看OpenAI赚得多快。老牌巨头和科技新星强强合作,微软想在下个AI十年挑战谷歌和其他科技巨头。

|Anthropic,出生于金钥匙,新生代球员

许多人都认为ChatGPT将推翻搜索引擎,微软在宣布其产品都要全线集成ChatGPT后,谷歌还着手研制自家对话模型。

去年年底AIGC大火,谷歌旗下云部门在AI初创公司Anthropic上投入大约3亿美元,拿到10%股权后,Anthropic最新估值接近50亿美元,成为继OpenAI之后又一领域独角兽。

此前的2021年,Anthropic获1.24亿美元A轮融资,2022年,获得加密货币交易所FTX联合创始人Bankman-Fried带领下的5.8亿美元资金,经过两轮融资,估值达到40亿美元。

有媒体称Anthropic制造的ChatGPT产品已在测试阶段。这款软件可以让用户在任何地方使用手机、平板电脑和其他智能设备,并能够处理海量数据处理任务。谷歌为了追赶微软,意在把Anthropic数据密集型的计算工作导入数据中心。类似的气味也随之产生,Anthropic近日宣布谷歌云作为“首选云提供商”,合作开发AI计算系统。这不禁让人想起三年前,微软向OpenAI注资10亿美元,成为OpenAI专属云供应商。

Anthropic和ChatGPT开发公司OpenAI关系暧昧,前一位创建者多数是离开OpenAI的数位高管,他们是2020年年末,OpenAI的早期员工Dario Amodei带着10名员工加入“硅谷叛徒”俱乐部,拿着1.24亿美元创办Anthropic。

通用人工智能聊天机器人Claude正在研制中,Anthropic会手持这一新的资金,继续进行计算密集型的研究,以发展可操控、一个可解释的和健壮的大范围人工智能系统同时,谷歌云部门提供计算能力,并拥有高级人工智能芯片,Anthropic打算利用这些芯片,培训并部署自己的未来人工智能产品。

|Hugging face:以社区为主,成长型球员

Hugging Face,一家十分活跃的人工智能创业公司,早期依靠Transformers模型库,以及十分强大而活跃的人工智能社区,受到了业内外人士的重视。

创始人Clément Delangue来自法国,17岁开始连续创业,再折腾了几家创业公司。他在创业初期遇到了一些困难,但很快就找到了一个好的商业模式——用机器人来完成人与机器之间的交互。Hugging Face最初的发展方向就是对话机器人,获得来自Betaworks、杜兰特等人的天使融资,但是工程的进展不大。

谷歌在2018年推出了一个自然语言处理预训练模型BERT,该模型是建立在transformer机器学习方法之上,标志着人工智能您就像一个预训练模型,大炼模型的参数。这个技术让很多人都开始关注机器学习。此后,他们为培养机器人NLP能力,为部署机器学习模型编制底层库,并且在GitHub中实现了开源,追赶Transformer的潮流,顿时火冒三丈。

就像存放Git repo的地方叫Github,在Hugging Face Hub,可发现数万种已训练模型,用户可通过Hugging Face对ML模型,数据集进行托管与分享,还可自行构建部署新模式。

有关自然语言处理方面的文章有不少,以及各实验室研制的型号,若要将其移植至本身应用程式之上,亦有一定难度,Hugging Face尝试解决此类问题。他们将这些架构各异的模式,包成规格统一的API,使工程师们能够更加方便地运用。

除此之外,Hugging Face所提供之Library也使使用者能较容易利用Transformer来进行自然语言处理之应用程式(包括,最常用到的神器比如Transformer、Tokenizers和Datasets,能提供开发策略,执行前,后处理的资料收集及其他功能。

完整生态系与社群,给人一种感觉,几乎可以只使用Hugging Face,仅仅完成了大多数最难的Transformer。

截至目前,Hugging Face上共有近13.5万个预训练模型,在GitHub上拥有超过1660名贡献者,54000名用户,81000颗stars和18000次forks,在Hugging Face上下载的模型日均达五万人以上。

2019年底,Lux Capital的Brandon Reeves遇到Delangue,投了8000万美元。这是该公司有史以来最大的一笔投资,也是在全球范围内最大规模的一次融资。截至2022年5月,Hugging Face获得1亿美元C轮融资,由Lux Capital领投,Sequoia US、Coatue等跟投。

当前Hugging Face现在拥有成千上万的用户和组织,其中包括微软,英特尔,高通等、谷歌和彭博社等。这家公司是全球最大的网络视频技术供应商之一。尽管上一年的收入还不到1000万美元,但是,前一轮融到4000万美元的资金仍然储存在公司银行账户中,并被披露,该公司去年中期已经接近盈亏平衡,估值为20亿美元。

Jasper:为PLG服务的典型运动员

在ChatGPT以前,Jasper是曾经最为人所关注的“AI文字生成等”工具。它可以用来写视频脚本、广告营销文本额邮件,及其他带有重复性的文字工作。

年轻的企业,创建于2021年。他们的团队也很有激情,但很快就发现这些人并不是自己想要的那样——他们需要一些专业技术和技巧,比如如何写好一篇文章。创建者Rogenmoser相信Jasper非常激进,最开始的设想就是要制作一款招聘软件,后与友人船板,做小营销,提供网站内容,Facebook广告,搜索引擎优化等文案服务。Rogenmoser及其朋友们没有任何这些能力,因此,他们更倾向于寻求外包。

那时候,Rogenmoser在Twitter上看到人们谈论GPT-3,该模式在AI圈中非常火爆,Rogenmoser及其伙同者捕捉到这一风口,做出对话式AI雏形,并向企业用户进行销售。

成立一年来,团队仅有九人,10个月后扩增至160人。在这个创业初期阶段,”小巨人“的诞生是一个奇迹,它不仅颠覆了传统的商业模式,也让创业者们看到了互联网时代下的巨大商机。”当时The Information报道,预计年营收将超过6000万,同年10月,Coatue与Insight Partners、Bessemer Venture Partners等公司一起参与了8500万美元的A轮融资,Jasper成为有史以来最迅速到达独角兽行列的企业。

Jasper在去年下半年再获1.25亿美元的资金支持,价值15亿美元,同时,其客户数量为10万名人,Jasper在资本市场上的受欢迎程度是显而易见的。首席执行官Dave Rogenmoser表示,为创建Jasper核心产品提供资金、提升客户体验、并且在更多的应用程序中导入了Jasper技术,例如,最新发布了图像生成产品Jasper Art。

ChatGPT由Open AI根据其GPT-3大模型制作而成,是一款聊天机器人的应用;而Jasper的技术底层也是OpenAI的GPT-3。即Jasper以竞争对手为平台,创立了属于自己的事业,这正是其今后发展中存在的一个风险来源,也就是说,对Jasper顾客,他们会继续使用吗,主要是看使用效果是否优于对手,及OpenAI所公开的API能否为不同区域所接收。

|Inflection AI:有一些事情但是不多型的球员

Inflection AI为通用建模领域私人企业,作为机器学习的初创企业,它已经研制出几种神经网络,能够对自然语言文本进行优化处理,在AI人机交互领域为用户提供一站式解决方案。

据悉,该公司于去年5月份获A轮融资2.25亿美元,资金来源不明,估值在12亿以上。它将使用其拥有自主知识产权的开源技术,为全球用户提供一个基于机器学习算法的语音合成平台。Inflection筹资规模,体现出复杂AI系统建设的高昂代价。这家初创企业的目标是提供一种新的方法来处理自然语言理解任务中的大规模数据。OpenAI估计已经花了几百万美元开发GPT-3,本公司系统能够产生与人相似的文本,同时提供提示。

Mustafa Suleyman是Inflection AI的CEO兼联合创始人,他还是DeepMind AI实验室创始会员,并在谷歌收购DeepMind 6年之后,担任谷歌人工智能产品和政策副总裁,

去年CNBC介绍,Suleyman期望所搭建的产品可以简化人和机器之间沟通的要求,运用人工智能,有助于人类和计算机之间的“对话”。他认为,“未来是一个真正的人机互动时代,我们可以通过使用语音或文字进行交流。他宣称,Inflection正在研发一整套新的技术,最后会让任何一个人可以和计算机进行简单语言对话。Inflection向什么样的潜在客户销售自己的产品,现在还不得而知、该产品价格及问世时间亦未公开。

把人的意图翻译成计算机语言,就连今天最优秀的聊天机器人、语音助手都未能实现,Suleyman却提出,未来人工智能的发展将在未来五年内实现可视化的人机界面。用联合创始人Dario Amodei的话来说是“探索机器学习系统的可预测扩展特性”。

|stability.ai:开源,开放式技术型参赛者

同在去年10月份,爆火文本对图像模型Stable Diffusion后面创业公司Stability AI在Coatue上宣布、Lightspeed Venture Partners和O'Shaughnessy Ventures领导的一轮融资中筹集了1.01亿美元。这轮融资后,Stability AI公司的估值已经到达10亿美元。

这个企业的来历同样耐人寻味。当AI技术的研究受有限算力与经费约束时,Open AI给AI研究人员一个比较自由的环境,和巨大的金钱和算力作为后盾,能够协助技术研发部门集中精力向AIGC纵深发展。

但是因为2020年时内部出现了问题,导致不能支持非盈利项目跟进,造成了大量核心研究员的跑路,以Open AI为核心,提出企业价值理念,当过工程师、分析师的Emad Mostaque创办了Stability AI,期望继续保持非盈利模式、在更开放经营理念下。

Stable Diffusion就是一种基于文字来产生画面的AI技术模型,仅需几秒,便能产生分辨率和清晰度更高的图像,既不丧失真实性,又不丧失艺术性的照片。这个算法在全球范围内被广泛使用。它有一个由4000多个Nvidia A100 GPU组成的集群,用于培训AI系统,其中就包括Stable Diffusion。其维护成本是相当可观的,Stability AI运营和云计算支出超过5000万美元。

Mostaque表示,此轮融资将被用来向客户部署定制版本的更大Stable Diffusion,并将在算力方面投入较大资金。这些钱也会被用来雇用更多的工人,据预测,今后一年,公司的员工人数将从100人增加到300人左右。

除了Stable Diffusion,Stability AI也有一些可以商业化的计划在执行,包括产生音频,语言等、"3D"甚至是视频的人工智能模式。这些技术都是在研究如何将语音识别与机器学习相结合而产生新功能。其中有一条是现在公开发行的"Dance Diffusion",它可通过培训几百小时已有歌曲产生音乐片段。

参与此轮投资的Coatue公司在声明中表示:"在Coatue,我们相信开源的人工智能技术有能力释放人类的创造力,并实现更广泛的利益。我们很高兴能成为Stability AI旅程的一部分,我们期待能看到全球各方用Stability AI的技术创造出什么。"

|Character.AI:创建者为谷歌的20年老雇员

Character.AI的创始人Noam Shazeer是前谷歌首席软件工程师,也是Transformer论文作者之一。在此之前,他于2000年年底进入谷歌工作,直至2021年才终于卸任,是谷歌早期的主要雇员。

另一名共同创始人Daniel De Freitas还是谷歌的前任研究人员,他们以前在公司内部LaMDA系统工作过。在过去一年中,他们开始将注意力转向人工智能技术应用于语音交互领域,希望通过开发一种新的交互方式来取代目前广泛使用的人工输入方式。该企业创建于2021年10月份,对该企业组织架构及业务模式,外部可获得信息量小。有消息称Character AI已在LaMDA上建立神经语言模型聊天机器人Web应用程序,能产生与人相似的文本响应,参与语境中的对话。

通俗地说,这个产品给用户带来的是和虚拟聊天机器人chatbot的功能,谁能和虚拟唐纳德特朗普相处、埃隆马斯克,声名狼藉的“绝命毒师”沃尔特怀特等众多人物侃侃而谈。

据The Information报道,该公司现正谋求募集2.5亿美元的资金。这家公司是全球最大的独立软件供应商之一。目前投资者包括Gmail创始人Paul Buchheit和前GitHub首席执行官Nat Friedman,估值也在10亿美元左右。这家公司正在寻求其他更多投资,以帮助它扩大自己的规模并提高盈利能力。报道说已和红杉资本等一流风险投资公司举行会谈,讨论尚在初期,他们能不能成功,还有待观察。

|Adept:另一个黑马型球员

去年4月,Adept AI成立,业务重点是建立一个以和文本生成工具同样核心技术为基础的机器人,由首席科学家Ashish Vaswani和CTO Niki Parmar,和现任CEODavid Luan三人一起创办。该公司将主要开发语音识别技术和人工智能技术应用到机器人上,帮助用户解决复杂任务,如阅读文本,翻译文档等。目前,市场猜测估值约为10亿美元。

他们都曾经是谷歌大脑的核心员工,其中Luan是GPT-2、PaLM的论文作者之一,参与了GPT-3的部分工作;CTO和首席科学家都是Transformer论文的作者之一,也汇聚了大批曾经供职于谷歌的技术人才。

去年,该公司从Addition和Greylock等公司获得了6500万美元的融资,投资人包括Scott Belsky(Behance创始人)、Howie Liu(Airtable创始人)、Chris Re(斯坦福)、Andrej Karpathy(特斯拉Autopilot负责人)和Sarah Meyohas,Luan准备用这笔钱来穿过一个可读写和可运行的转换器,进一步优化智能技术等。

说到为什么要离开谷歌去创业,Luan觉得,我们培养的Transformer也越来越多,其目的在于最终构造出一种能够支持全部ML用例。这意味着,你可以将自己的产品变成一个完整的智能体。但是在进程中研究小组找到了重大的制约因素:GPT-3等型号能写得很好散文,但它们无法在数字世界中采取行动。

您不可能要GPT-3的机票,向供应商开出支票,或做科学实验或用Airtable,Photoshop,ATS等、Tableau和其他工具执行任务。因为它们只是一个软件,而不是一个硬件。因此,媒体注意到,Adept更多地追求协作智能,它所选择的路径与其它通用人工智能公司并不一样,前者为AI工具的设置,为了帮助人类实现使命。在过去十年里,许多人都把注意力集中到了如何将机器学习应用于人工智能上。这样比较容易实现。

“变压器及其应用代表了近代史上迈向通用智能的最大一步。但我们认为,真正的通用智能需要能够行动的变形金刚——而不仅仅是读写。”Luan说,“在Adept,

我们在培训一种模型,用现在大家都在用的各种软件工具以及API。这个模型将在不久的将来实现,它能够使用户通过互联网就能访问到任何一种软件或应用程序。”

丨百度:中国本土重量级运动员

以AI为主打的百度绝对不会放过这一科技盛宴。尽管国内ChatGPT已将AIGC逼到了暴发的前夕,不过目前阿里、腾讯、字节这样的大佬,还有科大讯飞、天娱数科和其他细分领域的公司布局,多数还是围绕着提升工作效率而展开。

据悉,早于2019年,百度推出了我国第一个官方公开预训练模型ERNIE1.0,并且不断投入到大模型研发升级中;2021年伊始,ERNIE 3.0升级成知识增强千亿大模型——鹏程-百度文心。

文心大模型是建立在大范围知识与大量无结构数据相结合的深度学习基础之上的,吸纳了大量文本数据的词汇,结构、语义和其他知识,并且通过不断的学习来不断的提高理解能力以及生成能力来达到对视频,歌词的理解、自动生成艺术画和其他创意作品。

去年年底,文心大模型开始了全面的更新。在模型层一次性发布11个大模型,覆盖了基本的大模型、任务大模型,行业大模型三个层次体系;服务层则是搭建一个开放、透明和便捷的一站式解决方案平台——“文心通”,为用户提供更多选择和便利,同时也让模型开发者获得更大收益。工具和平台层,提升大模型开发套件的功能、文心API以及提供全流程开箱,即使用大模型能力EasyDL与BML开发平台;增加新的产品和社区层,收录AI艺术及辅助创作平台“文心一格也”、产业级搜索系统“文心百中”以及旸谷社区为个人用户提供服务。

继ChatGPT后,百度最近又启动了一个全新的大模型“文心一句”计划,发布新闻的那天,港股股价一天之内飙升15%,美股股价也上涨12%。在人工智能领域,文心雕龙、文思泉涌、文心如泉等概念成为市场关注焦点。根据百度的证实,文心一言的内测定于3月份结束,向公众开放。目前已有部分开发者参与进来。并根据谷歌与微软加速发布类ChatGPT服务,文心一言开放内测还有可能提前。文心一言内测版将支持多语言输入、语音识别等技术,并提供更丰富的内容资源,让用户能通过手机随时收听视频节目或听音乐。多家企业宣布介入文心一言,并带动百度股价走高。

|Synthesia:以录像为主,硅谷型运动员

2021年年底,Synthesia宣布完成B轮融资,由硅谷风险投资公司Kleiner Perkins领头,GV和Firstmark Capital、LDV Capital、欧洲大型科技创业孵化平台Seedcamp和MMC Ventures的参与。本轮融资将主要用于扩大其实验室设施并增加更多新产品研发项目及服务。此轮融资结束后,Synthesia融资总额达5000万美元。

早在2021年4月,Synthesia就完成筹集1250万美元的A轮融资,到目前为止,官方还没有披露该企业具体估值情况。该项目主要是为用户提供一个基于人工智能的智能交互系统。然后增加了一些新的功能,用户能够很方便地建立其虚拟的人物形象。这也是全球首个通过互联网技术建立的虚拟人物。目前,Synthesia有1000个自定义人物形象。虚拟人物的设计和发布都是由专业团队来执行的。里帕贝利以安永会计事务所为例,它使用Synthesia平台建立虚拟形象并进行录像,与35家合作伙伴进行内部通信和交流。

但具体来说,就是产品功能,据媒体报道,Synthesia在早期就可以把文本或者幻灯片变成视频,附有能言善辩的角色形象。“用户可基于预设虚拟人物,或上传视频创建自己的虚拟形象。此外,用户还能上传语音素材,转化成所需内容。”

由于Synthesia认为几乎所有网络工具都可能被利用进行不当用途,因此,该企业仅面向企业客户,而非以个体为导向。这家公司正在开发一个新技术以帮助企业在社交媒体上发布产品或项目。Synthesia表示,顾客主要利用产品工具进行培训视频的拍摄,然而,这类用户群体与创建者Victor Riparbelli的想法却不尽相同。

“以前,人人都可以制作幻灯片或编写Word文档,现在他们还可以自己创建视频。从人工智能技术的角度来看,这是我们快速发展的关键所在。”在他看来,与视频制作部门拥有大量用户相比,组织内部其他人则是这个工具的超级使用者。

Synthesia进一步开发虚拟人物视频,让它的视觉、感官与真人相似,例如,一位名不见经传的男演员,还是自己企业的首席执行官。

关键词:

评论