普拉格能源(PLUG):
普拉格能源(PLUG) 8-K Current report, items 7.01 and 9.01 Accession Number: 0001104659-23-008174 Act: 34 Size: 232 KB 网页链接
专精特新研习社:
伴随国内氢能产业发展政策和技术条件的日益完备,不少经历或见证过锂电“风口”的企业已不动声色的向氢能产业集结。不完全统计数据显示,当前国内涉及燃料电池产业链环节的上市公司已超30家,雄韬股份就是其中的重要代表之一,雄韬氢雄作为雄韬股份的氢能源战略的实施环节,成功的抓住了这个机遇,成为跻身于国内氢能源产业链的前列,成为国内氢能源产业解决方案的领跑者,今天就让我们大家了解下雄韬氢雄是怎样在氢能源产业链上开疆拓土的。
母子“氢”近 构建氢能产业链版图
据了解,雄韬股份早在2010年就已经开始氢燃料电池领域的布局,此后便开始在北京、上海、深圳、湖北武汉、山西大同、浙江、广州等城市扩张氢能版图。
2016年,公司通过股权投资北京氢璞创能,布局最具核心竞争力的燃料电池电堆,而该企业是当时国内首个自主知识产权电堆自动化生产线的缔造者。2017年,公司又开始布局专注于燃料电池发动机系统集成的浙江氢途科技,并于同年全资成立了雄韬氢雄,该公司现已成长为雄韬股份旗下自有的燃料电池全产业链一体化平台。为了解决最具技术壁垒的膜电极生产,公司又先后投资了苏州擎动和武汉理工氢电,其中武汉理工氢电拥有国内生产规模最大的膜电极生产线,具有国际一流的研发技术与团队。
2019年,公司进一步将氢产业链版图横向延伸至加氢站,战略投资了上海氢枫,该企业主要从事于加氢站的设计、建设和运营。电堆是氢燃料电池最核心的部件,雄韬股份为掌握核心技术,2020年全资成立了雄韬氢瑞,专注于高性能电堆的研发。也就在同年年底,雄韬氢瑞就公布了全行业最低价1199元/kW的电堆产品。自此,公司通过股权投资与合资办厂等多种方式,实现了在氢能产业链上膜电极、燃料电池电堆、燃料电池发动机系统、加氢站等关键环节的卡位布局,旨在打造氢能产业平台,整合和拓展氢能产业链的相关资源。
雄韬氢雄作为公司燃料电池全产业链一体化平台,分别完成了华北、华南、华中、华东闭环布局。氢雄云鼎负责华北区域,具备燃料电池发动机5万套、燃料电池电堆5万套产能;华南区域由广东雄韬氢恒负责,电堆生产产能布局在公司总部;武汉雄韬氢雄则负责华中地区,具备燃料电池发动机10万套、燃料电池电堆10万套、膜电极50万㎡的全核心部件制造产能;华东地区公司成立了上海氢雄——发动机及氢能智能驾驶创新研发中心,未来将会建成氢雄华东产业化基地。
目前雄韬股份的氢能产业链不仅包括上游关键材料及零部件,而且还包括下游加氢站等全产业链。此时,雄韬氢雄已经完成制氢、膜电极、燃料电池电堆、燃料电池发动机系统、整车运营等关键环节的卡位布局。
关键零部件实现国产化技术攻关
我国燃料电池发展历史较国外较短,虽然发动机系统、电堆等实现了国产化,但是技术含量较高的膜电极依旧在很大程度上依赖海外。雄韬股份凭借多年的行业经验,与国内具有膜电极完全自主研发能力的武汉理工大学,联合发起成立了武汉理工氢电科技有限公司,持有该公司50.07%的股权。
武汉理工氢电主要采用第二代膜电极生产工艺(CCM)进行生产,合格率已经提升到97%,但价格下降了30%,目前产品售价为1万元/。现阶段正在进行第三代膜电极研发,目标是使载铂量降低至0.125g/kw。目前,武汉理工氢电在国外排名第五,市场占有率为4.56%,国外主要的采购商为plug;国内市场占有率大约为20-30%之间,国内出货膜电极装车超过300辆。未来三年,随着成本下降50%以下左右,膜电极销售价格将到5000元/㎡以下,届时电堆成本860元/kW,系统销售价格2000元/kW,发动机系统价格20万元,结合氢源供给将实现经济性拐点。
目前,雄韬股份燃料电池主要系统功率有52/61/84/90KW等几个系列,2020年完成了130KW系统产品,2021年已实现产品量产,并进一步降低系统产品成本20%,2023年实现系统产品成本降低50%左右,并全部实现国产化。
在燃料电堆方面,国内大部分的燃料电池电堆采取的都是双极板模式,而雄韬氢瑞选择了直接挑战单电池模式。这就意味着国内较为成熟的膜电极结构以及生产工艺均无法采用,需要寻找新的膜电极边框材料,新的膜电极制备工艺,还需要探索单电池制备工艺。不同的环节,相同的高要求高标准。雄韬氢瑞W1.0最终完美匹配乘用车领域的应用,正是雄韬氢瑞踏实钻研,深耕技术的成果体现。
全面迎接碳中和时代 打造多场景智慧能源场景
雄韬氢雄在氢能产业链上已完成制氢、膜电极、燃料电池电堆、燃料电池发动机系统、整车运营等关键环节的卡位布局。同时公司已经在低载铂量催化剂、膜电极、铝制氢等各个领域自行投入研发,并取得阶段性成果,产业布局涉及深圳、武汉、大同、上海、广州、青岛等城市。
雄韬氢雄的燃料电池发动机系统涵盖VISH和VISTAH两个系列,功率覆盖52-130kW,已匹配20款燃料电池客车、49款燃料电池卡车/底盘和5款工程机械领域应用车型进入工信部公告目录,现有包括公交、重卡、物流合计240辆燃料电池车已投入示范运营,运营里程超过1000万公里,另有118辆燃料电池车正在交付中。
而其旗下另一家公司雄韬氢瑞,则拥有自主知识产权的首代A1电堆,采用石墨双极板,单电池均一性指标高,单堆额定功率42-84kW, 设计寿命超过15000小时,体积功率密度比3.5kW/L,适用于商用车、重卡等应用,目前已迈开商业化步伐。
氢能是中国由高碳能源向低碳化、最终转变为无碳化能源的第三次能源革命中重要的能源载体。展望未来,雄韬氢瑞坚信,氢能是未来能源革命的重要突破口之一,公司将以产品体系的更多元化与高端性,继续为行业焕新注入新的力量,持续助力新能源产业的更新进化。
思宇MedTech:
文章来源:思宇MedTech
转载要求:请在文首标明文章来源,可直接转载
2023年1月10日,思宇MedTech关注到美国专利及商标局(United States Patent and Trademark Office,缩写USPTO)公布了21项奥林巴斯影像相关专利,附上公示英文及简要翻译,供感兴趣的读者参考。
ELECTRONIC MODULE, METHOD OF MANUFACTURING ELECTRONIC MODULE, AND ENDOSCOPE
电子模块、制造电子模块的方法和内窥镜
Publication number: 20230007769
Abstract: An electronic module includes a three-dimensional wiring board including a cavity portion in which a bottom surface and four wall surfaces are formed, a plurality of electrodes being provided class="ke_img" >
而在国内,超大模型研发展异常迅速,2021 年成为中国 AI 大模型的爆发年。2021 年,商汤发布了书生(INTERN)大模型,拥有 100 亿的参数量,这是一个相当庞大 的训练工作。在训练过程中,大概有 10 个以上的监督信号帮助模型,适配各种不同 的视觉或者 NLP 任务,截至 2021 年中,商汤已建成世界上最大的计算器视觉模型, 该模型拥有超过 300 亿个参数;同年 4 月,华为云联合循环智能发布盘古 NLP 超大 规模预训练语言模型,参数规模达 1000 亿;联合北京大学发布盘古 α 超大规模预训 练模型,参数规模达 2000 亿。阿里达摩院发布 270 亿参数的中文预训练语言模型 PLUG,联合清华大学发布参数规模达到 1000 亿的中文多模态预训练模型 M6;7 月,百度推出 ERNIE 3.0 知识增强大模型,参数规模达到百亿;10 月,浪潮信息发布 约 2500 亿的超大规模预训练模型“源 1.0”;12 月,百度推出 ERNIE 3.0 Titan 模型, 参数规模达 2600 亿。而达摩院的 M6 模型参数达到 10 万亿,将大模型参数直接提 升了一个量级。2022 年,基于清华大学、阿里达摩院等研究成果以及超算基础实现 的“脑级人工智能模型”八卦炉(BAGUALU)完成建立,其模型参数模型突破了 174 万亿个,完全可以与人脑中的突触数量相媲美。
部分公司中国公司虽然目前还没有正式推出自身大模型产品,但是也在积极进行研 发,例如云从科技,公司的研究团队高度认同“预训练大模型+下游任务迁移”的技 术趋势,从 2020 年开始,已经陆续在 NLP、OCR、机器视觉、语音等多个领域开展 预训练大模型的实践,不仅进一步提升了公司各项核心算法的性能效果,同时也大 幅提升了公司的算法生产效率,已经在城市治理、金融、智能制造等行业应用中体 现价值。 而且,中国的超大模型并不落后于国外同类产品,在某些领域还能实现反超。以商 汤科技的书生(INTERN)为例,书生(INTERN)在分类、目标检测、语义分割、深 度估计四大任务 26 个数据集上,基于同样下游场景数据(10%),相较于同期 OpenAI 发布的最强开源模型 CLIP-R50x16,平均错误率降低了 40.2%,47.3%, 34.8%,9.4%。同时,书生只需要 10%的下游数据,平均错误率就能全面低于完整 (100%)下游数据训练的 CLIP。
可以看到,国内外众多公司和研究机构积极开展对大模型的研发。目前,大模型参 数规模最高可达百万亿级别,数据集达到 TB 量级,且面向多模态场景(同时支持文 字、图像、声音、视频、触觉等两种及以上形态)的大模型已成为趋势。大模型生 态已初具规模。
1.2 大模型能给 AI 产业带来什么
1.2.1 大模型加速 AI 产业化进程,降低了 AI 应用的门槛
人工智能正处于从“可以用”逐渐走向“好用”的落地应用阶段,但目前仍处于商业落 地早期,主要面临着场景需求碎片化、人力研发和应用计算成本高、长尾场景数据 较少导致模型训练精度不够、模型算法从实验室场景到真实场景效果差距大等行业 痛点。而大模型的出现能够在在提高模型的通用性、降低训练研发成本方面等方面 降低 AI 落地应用的门槛。
(1)大模型能够实现 AI 从“手工作坊“到”工厂模式”的转变
过去十年中,通过“深度学习+大算力”从而获得训练模型是实现人工智能的主流技术 途径。由于深度学习、数据和算力这三个要素都已具备,全世界掀起了“大炼模型” 的热潮,也催生了大批人工智能企业。但是,在深度学习技术兴起的近 10 年间,AI 模型基本上是针对特定应用场景需求进行训练的,即小模型,属于传统的定制化、 作坊式的模型开发方式。传统的 AI 模型从研发到投入应用需要完成包括确定需求、 数据收集、模型算法设计、训练调优、应用部署和运营维护等阶段组成的整套流 程。这意味着除了需要优秀的产品经理准确确定需求之外,还需要 AI 研发人员扎实 的专业知识和协同合作能力完成大量复杂的工作。
传统模式中,研发阶段,为了应对各式各样的场景需求,AI 研发人员需要设计专网 专用的个性定制化神经网络模型。模型设计过程要求研究人员具有充分的网络结构 和场景任务专业知识,且需承受人力设计网络结构的试错成本和时间成本。一种降 低专业人员设计门槛的思路是通过网络结构自动搜索的技术路线,但是这种方案对 算力要求很高,并且不同场景任务都要调用大量机器进行自动搜索以获取最优模 型,算力成本和时间成本仍然很高。一个项目往往需要专家团队实地驻场数月才能 完成,其中数据收集和模型训练评估是否能够达到指标要求往往需要多次循环迭 代,人力成本很高。 落地阶段,经“一个场景一个模型”式的作坊式模型开发得到的模型在许多垂直行业 场景任务不通用。譬如无人自动驾驶全景感知领域,常常需要多行人跟踪、场景语 义分割、视野内目标检测等多个模型协同作战才行;而同样是目标检测和分割应 用,在医学图像领域训练的皮肤癌检测和分割 AI 模型也无法直接应用到监控场景的 行人车辆检测和场景分割。模型无法复用和积累,同样导致了 AI 落地的高门槛、高 成本与低效率。
而大模型通过从海量的、多类型的场景数据中学习,并总结不同场景、不同业务下 的通用能力,学习出一种特征和规则,成为具有泛化能力的模型底座。基于大模型 进行应用开发或面对新的业务场景时,将大模型进行微调,例如在下游特定任务上 的小规模有标注数据进行二次训练,或不进行微调,就可以完成多个应用场景的任 务,实现通用的智能能力。由此利用大模型的通用能力可以有效的应对多样化、碎 片化的 AI 应用需求,为实现规模推广 AI 落地应用提供可能。
(2)大模型具有自监督学习能力,能够降低 AI 开发以及训练成本
传统的小模型训练过程中,涉及众多调参、调优的手动工作,需要大量的 AI 专业研 发人员来完成;同时,模型训练对数据要求高,需要大规模的标注数据。然而许多 行业数据获取困难、标注成本高,同时项目研发人员需要花费大量的时间收集原始 数据。譬如,人工智能在医疗行业病理学、皮肤病学和放射学等医学图像密集领域 的影响扩展增长,但是医学图像通常涉及到用户数据隐私,很难大规模获取到用于 训练 AI 模型。而在工业视觉瑕疵检测领域,以布匹瑕疵为例,市场上需要检测的布 匹种类包括白坯布、色坯布、成品布、有色布、纯棉、混纺等等,瑕疵种类繁多, 颜色、厚薄难以识别,需要在工厂里长时间地收集数据并不断优化算法才能做好瑕 疵检测。工业视觉应用场景千变万化,每个场景都具有专业知识的个性化的需求, 而不同行业的数据在另一个场景或任务可能并不适用,还需重新收集、标注数据和 训练模型,造成重复造车轮子现象,研发流程虽然相通,但研发的模型却难以复 用。此外,AI 模型也需要完整的、实时的支持机器自学习的数据闭环,从而能够不 断迭代优化。这一方面整体也导致了当前 AI 研发整体门槛、成本较高。 而大模型通过自监督学习功能将输入的原始数据直接进行自动学习区分,合理构造 适合模型学习的任务,不需要或很少需要通过人工标注的数据进行训练,很大程度 上解决了人工标注数据标签的高成本、长周期和精确度的问题,并降低了训练所需 要的数据规模。这在很大程度上减少了大模型训练数据获取、标注的成本,也更适 合于小样本学习,从而有利于将传统的、有限的 AI 扩展到更多的应用场景。
我们认为,大模型相对于传统 AI 模型开发模式在研发时拥有更标准化的流程,在落 地时拥有更强的通用性,可以泛化到多种应用场景;并且大模型的自监督学习能力 相较于传统的需要人工标注的模型训练能够显著降低研发成本,共同使得大模型对 于 AI 产业具有重要意义,为解决 AI 落地难、促进 AI 产业化进程这一问题提供方 向。
1.2.2 大模型带来更强大的智能能力
除通用能力强、研发过程标准化程度高外,大模型最大的优势还是在于“效果好”, 其通过给模型“填喂”大数据提高其自学习能力,进而具有更强的智能程度。比如在 自然语言处理领域,百度、谷歌等巨头的探索表明,基于预训练大模型的 NLP 技术 的效果,已超过过去最好的机器学习能力。OpenAI 的研究表明,2012 至 2018 年 6 年间,在最大规模的人工智能模型训练中所使用的计算量呈指数级增长,其中有 3.5 个月的时间计算量翻了一倍,比摩尔定律每 18 个月翻一倍的速度快得多。下一代 AI 大模型,参数数量级将堪比人类大脑突触的水平,并且或将不仅能处理语言模型, 将更是一个能处理语言、视觉、声音等多任务的多模态 AI 模型。大模型为通往强人 工智能提供了一条可能的通道。
从大模型发展历程中能够看出,多模态大模型是发展趋势之一。由于具有在无监督 情况下自动学习不同任务、并快速迁移到不同领域数据的强大能力,多模态大模型 被广泛认为是从限定领域的弱人工智能迈向强人工智能的路径探索。OpenAI 联合创 始人、首席科学家 Ilya Sutskever 也曾表示,“人工智能的长期目标是构建多模态神经 网络,即 AI 能够学习不同模态之间的概念,从而更好地理解世界”。将文本、语 音、图像、视频等多模态内容联合起来进行学习,大模型由单模态向多模态方向发 展,能够对更广泛、更多样的下游任务提供模型基础支撑,从而实现更加通用的人 工智能模型。 更具体来看,大模型带来的更强大的智能能力,能够推动人工智能向更高级智能应 用领域迈进,例如 AIGC、更智能的对话客服等领域。GPT-3 等大模型在新闻文本生 成、商业文本分析、法律文本分析等领域具有较高的产业应用价值。2022 年 OpenAI 发布的基于 GPT-3.5 的 ChatGPT 则能够以对话方式进行交互;除问答以外,ChatGPT 能够完成编程、写稿等众多超出人们想象的任务。甚至有研究人员表示未来 ChatGPT 这样的新兴人工智能技术很可能会影响白领的工作。在一项由医疗初创公 司 Ansible Health 领导的研究中,ChatGPT 参加美国医生执照的三项考试,考试成绩 可以达到或接近达到及格;ChatGPT 在法律领域的表现甚至更加优秀,研究人员发 现,ChatGPT 可以取得美国多州律师考试的及格分数;ChatGPT 的能力也已经获得了 大型科技企业的认可,谷歌公司指出,如果 ChatGPT 参加谷歌的面试,理论上会得 到入门级程序员的聘任。
2022 年,大模型正在成为 AIGC 领域发展的算法引擎。在大模型的能力加持下,包 括以文生图以及虚拟数字人等 AIGC 类应用将快速进入到商业化阶段,并为元宇宙内 容生产带来巨大的变革。大模型正在让人工智能技术从五年前的“能听会看”,走到 今天的“能思考、会创作”,未来有望实现“会推理、能决策”的重大进步。 我们认为,随着大模型不断地进步、迭代、向多模态方向发展,大模型能够达到更 强的通用性以及智能程度,从而使得 AI 能够更广泛地赋能各行业应用,尤其是更高 级智能应用领域,这是大模型能够给 AI 产业带来的突破之一,也是大模型构成人工 智能发展趋势和未来的原因之一。
2.1 大模型,智能时代的基础设施
大模型的“大规模”和“预训练”属性,决定了其具有能力泛化、技术融合、应用支撑 三大核心作用。 能力泛化方面,AI 大模型预先在海量通用数据上训练并具备多种基础能力,可结合 多种垂直行业和业务场景需求进行模型微调和应用适配,能够摆脱传统 AI 能力碎片 化、作坊式开发的束缚。AI 大模型得益于其“大规模预训练﹢微调”的范式,可以很 好地适应不同下游任务,展现出它强大的通用性。 技术融合方面,单个 AI 大模型通过端到端联合训练调优,能有效集成自然语言处 理、计算机视觉、智能语音、知识图谱等多个 AI 核心研究领域的多项技术,性能上 可实现“1+1>2”的效果,可显著提升 AI 大模型的功能丰富性和性能优越性。 应用支撑方面,AI 大模型已成为上层应用的技术底座,能够有效支撑智能终端、系 统、平台等产品应用落地,可解决传统 AI 应用过程中存在的壁垒多、部署难问题。
从人工智能到各行业的商业应用,可以看作是上下游的关系。而 AI 大模型因为其自 身而也正是大模型在能力泛化与技术融合方面的优势,使其在应用支撑方面具有先 进性;同时大模型做到了相对标准化,下游可以降低对算法的使用成本,以及商业 应用的适配成本。因此,大模型在 AI 产业链中将承担“基础设施”式的功能,作为底 座将 AI 技术赋能千行百业。也就是说,在基于数据的互联网时代、基于算力的云计 算时代之后,将进入基于大模型的 AI 时代。在未来,基于大模型,人工智能将如供 水供电一般流向终端,流向用户和企业。
如果将 AI 比作电力,那么大模型则相当于“发电机”,能将智能在更大的规模和范围 普及。大模型的智能能力在未来将成为一种公共基础资源,像电力或自来水一样随 取随用。每个智能终端、每个 APP,每个智能服务平台,都可以像接入电网一样, 接入由 IT 基础设施组成的“智力”网络,让 AI 算法与技术能够更广泛地应用于各行各 业。
基于大模型形成的大规模智能网络和云计算完全不同。云计算尽管也将算力比作随 取随用的资源,但目前仍然做不到像电力一样的方便。这是因为云计算本质上需要 云和用户进行双向的资源交换,用户需要经过繁琐的数据准备、计算过程定义等过 程,将数据和算法转移到云端,再由云端完成任务后传回本地。而基于大模型的大 规模智能网络则不需要用户定义计算过程,只需要准备好数据,大模型强大的能力 能够在少量微调甚至不微调的情况下直接完成用户所需的工作。这一智能能力生产 和消费的网络,未来或将成为人类社会产业发展的主流模式。 我们认为,大模型在能力泛化、技术融合、研发标准化程度高等方面的优势让其有 能力支撑各式应用,使其正在成为人工智能技术及应用的新基座。正如发电厂和高 速公路一样,大模型将成为各行各业应用 AI 技术的底座和创新的源头。
2.2 模型公司以大模型为基础赋能AI 产业链下游应用
从当前阶段来看,国际上大模型研究开展的时间较早,在研发过程中积累了一些经 验。目前有商业化应用案例的大模型主要包括 BERT、GPT-2、T-NLG、GPT-3 等。 BERT 主要适用于搜索、营销、金融等依赖深层语义理解的领域,例如,在检索领 域,谷歌目前已将 BERT 整合到搜索引擎中,为知识卡片和内容索引提供更为准确的 结果。在营销领域,一些企业采用了开源的 BERT 模型,BERT 能够将大量的用户反 馈内容进行整合,为下游的营销动作提供支持;GPT-2 更适合文本生成领域的任 务,在营销、文案、对话、媒体等领域的应用较多;T-NLG 模型是自然语言生成模 型,在文本生成、摘要等方面具有更强的性能;GPT-3 是目前商业化进展最快,应 用案例最多的大模型。基于 GPT-3 的下游应用主要集中在内容创意生成、语言/风格 互译、对话、搜索、游戏辅助开发等其它场景。
国内,商汤的业务模式能够大致体现 AI 大模型、AI 大装置承担基础设施功能,搭载 各式平台从而赋能百业。商汤拥有强大的人工智能基础设施 SenseCore,它以低成 本、高效率大规模生产高性能的人工智能模型。SenseCore 生产的人工智能模型具备 感知智能、决策智能、智能内容生成及智能内容增强等功能,被集成到公司的产品 及软件平台中以支持智慧城市、智慧商业、智慧生活以及智能汽车等垂直行业。业 务模式上,公司使用 SenseCore 在模型库中组装现有模型,并针对增量需求训练新 模型,从而以经济高效的方式配置产品方案。这类产品方案可通过软件平台向其他 客户提供。
SenseCore 提供强大的人工智能模型,可扩展及适应广泛的应用场景。SenseCore 可 以按需提供人工智能模型生产、训练、部署及迭代,以更大的灵活性服务于客户, 并缩短商业化时间。每一次 SenseCore 随着技术突破而升级,公司针对不同领域垂 直行业的软件平台都会同步升级,功能和性能方面得到明显改善。另一方面,众多 垂直行业也为 SenseCore 提供了丰富的场景及反馈,以促进 SenseCore 的演进。这种 飞轮效应使公司在与从事单一垂直行业人工智能公司竞争当中处于更有利的地位。
又比如云从科技,公司的研究团队高度认同“预训练大模型+下游任务迁移”的技术趋 势,从 2020 年开始,已经陆续在 NLP、OCR、机器视觉、语音等多个领域开展预训 练大模型的实践,不仅进一步提升了公司各项核心算法的性能效果,同时也大幅提 升了公司的算法生产效率,已经在城市治理、金融、智能制造等行业应用中体现价 值;其次,公司一直以来都在人机协同领域布局,打造了像人一样思考和工作的人 机协同操作系统(CWOS),致力于整合打通视觉、语音、NLP 等多个领域的大模 型,要彻底打通数字世界和物理世界,为“像人一样思考和工作”打下坚实的技术基 础;公司也通过开放的人机协同操作系统实现了技术平台化,加上多年的行业深 耕,能够通过“平台化的通用模型+带行业 knowhow 的专用模型”来帮助各行各业快 速实现智能化升级。
我们认为,模型公司能够发挥大模型作为 AI 基础设施与底座的能力,基于大模型 “大规模预训练﹢微调”的范式形成产品方案,并满足 AI 产业链下游各行业客户的应 用需求,模型公司将成为 AI 世界中的基础类公司。
3.1 OpenAI 的前世今生
OpenAI 成立于 2015 年 12 月,是所处于美国旧金山的一个人工智能研究实验室,由 非营利性的 OpenAI Inc.及其营利性的子公司 OpenAI LP 组成。OpenAI 开展人工通用 智能(AGI)研究,为了确保 AI 能够造福全人类,OpenAI 提供了一个基于 AI 的开发 和研究框架,这也是其名字的来源(开放 AI 能力)。利用 OpenAI 的平台,客户可 以快速提升开发技能并获取 AI 领域的专业知识,这有助于安全有效的通用人工智能 (AGI)技术的发展。OpenAI 开发、维护和训练了一批可用于通用活动的 AI 模型, 包括写作、阅读、编程和图像处理等,OpenAI 始终相信 AGI 对我们日常生活的影响 将远远超过早期的 AI 技术。 马斯克、奥特曼和其他投资者于 2015 年 12 月宣布创建 OpenAI,并承诺向该项目投 入超过 10 亿美元。通过公布其专利和研究成果,OpenAI 将与其他组织和研究人员 “自由互动”。“OpenAI Gym”的公测版本于 2016 年 4 月 27 日发布,这是一个加强 OpenAI 研究领域的平台。2016 年 12 月 5 日,OpenAI 发布了“Universe”,这是一个 用于开发和测试 AI 的平台,智能能力可以覆盖全球的网站、游戏和其他应用程序。
2019 年 3 月 11 日,OpenAI 宣布从“非盈利(non-profit)”性质过度到“有限盈利 (capped for profit)”,利润上限为任何投资的 100 倍(创立了 OpenAI LP 公司)。 也是在 2019 年,微软向 OpenAI 投资了 10 亿美金,并获得了 OpenAI 技术的商业化 授权。从此,OpenAI 的一些技术开始出现在微软的产品和业务上。不过,OpenAI 与 微软的合作其实从 2016 年就开始,2016 年,微软的云服务 Azure 为 OpenAI 提供了 大规模实验的平台。Azure 彼时已经为他们提供了带有 InfiniBand 互连的 K80 GPU 的 算力资源,以优化深度学习的训练。2020 年 9 月 22 日,OpenAI 开始授权微软使用 他们的 GPT-3 模型,也是全球首个可以享受 GPT-3 能力的公司。 2020 年 6 月 11 日,OpenAI 发布了 OpenAI API,这也是 OpenAI 第一个商业化产品。 官方解释了,他们认为开发商业产品是确保 OpenAI 有足够资金继续投入 AI 研究的 有效手段。自此,OpenAI 也正是开始商业化运作。官方也解释了,使用 API 的方式 提供模型而不是开源模型也将降低模型的使用门槛,毕竟对于中小企业来说,部署 强大的 AI 模型所需要的成本可能更高。
2018 年
2018 年 6 月 11 日,OpenAI 公布了一个在诸多语言处理任务上都取得了很好结果的 算法,即著名的 GPT,这也是该算法的第一个版本。GPT 是第一个将 transformer 与 无监督的预训练技术相结合,其取得的效果要好于当前的已知算法。这个算法算是 OpenAI 大语言模型的探索性的先驱,也使得后面出现了更强大的 GPT 系列。 同样是在 2018 年 6 月份,OpenAI 的 OpenAI Five 已经开始在 Dota2 游戏中击败业余 人类团队,并表示在未来2个月将与世界顶级玩家进行对战。OpenAI Five使用了256 个 P100 GPUs 和 128000 个 CPU 核,每天玩 180 年时长的游戏来训练模型。在随后的 几个月里 OpenAI Five 详情继续公布。在 8 月份的专业比赛中,OpenAI Five 输掉了 2 场与顶级选手的比赛,但是比赛的前 25-30 分钟内,OpenAI Five 的模型的有着十分 良好的表现。OpenAI Five 继续发展并在 2019 年 4 月 15 日宣布打败了当时的 Dota2 世界冠军。
2019 年
2019 年 2 月 14 日,OpenA 官宣 GPT-2 模型。GPT-2 模型有 15 亿参数,基于 800 万 网页数据训练。2019 年 11 月 5 日,15 亿参数的完整版本的 GPT-2 预训练结果发 布。 2019 年 3 月 4 日,OpenAI 发布了一个用于强化学习代理的大规模多代理游戏环境: Neural MMO。该平台支持在一个持久的、开放的任务中的存在大量的、可变的代 理。 2019 年 4 月 25 日,OpenAI 公布了最新的研究成果:MuseNet,这是一个深度神经 网络,可以用 10 种不同的乐器生成 4 分钟的音乐作品,并且可以结合从乡村到莫扎 特到披头士的风格。这是 OpenAI 将生成模型从自然语言处理领域拓展到其它领域开 始。
2020 年
2020 年 4 月 14 日,OpenAI 发布了 Microscope,这是一个用于分析神经网络内部特 征形成过程的可视化工具,也是 OpenAI 为了理解神经网络模型所作出的努力。 2020 年 5 月 28 日,OpenAI 正式公布了 GPT-3 相关的研究结果,其参数高达 1750 亿,这也是当时全球最大的预训练模型,同年 9 月,GPT-3 的商业化授权给了微软。2020 年 6 月 17 日,OpenAI 发布了 Image GPT 模型,将 GPT 的成功引入计算机视觉 领域。
2021 年
2021 年 1 月 5 日,OpenAI 发布 CLIP,它能有效地从自然语言监督中学习视觉概念。 CLIP 可以应用于任何视觉分类基准,只需提供要识别的视觉类别的名称,类似于 GPT-2 和 GPT-3 的 "zero-shot "能力。 2021 年 1 月 5 日,OpenAI 发布了 DALL·E 模型,其为 120 亿个参数的 GPT 3 版本, 它被训练成使用文本-图像对的数据集,从文本描述中生成图像。 2021 年 8 月 10 日,OpenAI 发布了 Codex。OpenAI Codex 同样是 GPT 3 的后代;它 的训练数据既包含自然语言,也包含数十亿行公开的源代码,包括 GitHub 公共存储 库中的代码。OpenAI Codex 就是 Github Coplilot 背后的模型。
2022 年
2022 年 1 月 27 日,OpenAI 发布了 InstructGPT。这是比 GPT 3 更好的遵循用户意图 的语言模型,同时也让它们更真实,且 less toxic。 2022 年 3 月 15 日,OpenAI 新版本的 GPT-3 和 Codex 发布,新增了编辑和插入新内 容的能力。 2022 年 4 月 6 日,DALL·E2 发布,其效果比第一个版本更加逼真,细节更加丰富且 解析度更高。 2022 年 6 月 23 日,OpenAI 通过视频预训练(Video PreTraining,VPT)在人类玩 Minecraft 的大量无标签视频数据集上训练了一个神经网络来玩 Minecraft,同时只使 用了少量的标签数据。通过微调,该模型可以学习制作钻石工具,这项任务通常需 要熟练的人类花费超过 20 分钟(24,000 个动作)。它使用了人类原生的按键和鼠标 运动界面,使其具有相当的通用性,并代表着向通用计算机使用代理迈出了一步。 2022 年 9 月 21 日,OpenAI 发布了 Whisper,这是一个语音识别预训练模型,结果 逼近人类水平,支持多种语言。
3.2 ChatGPT 的横空出世,对搜索领域或带来巨大冲击
2022 年 11 月 30 日,OpenAI 发布 ChatGPT,这是一个 AI 对话系统,一款人工智能技 术驱动的自然语言处理工具。它能够通过学习和理解人类的语言来进行对话,还能 根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、 视频脚本、文案、翻译、代码等任务。 ChatGPT 经历了 OpenAI 开发的四代 GPT 模型的进化。此前的三代模型数据质量和数 据规模不断提升,使得其生成能力不断精进,已经能够执行阅读理解、机器翻译、 自动问答等任务,但本质上只是语言模型,不具备回答问题的能力。针对 GPT-3, OpenAI引入了1750亿的训练参数,开启了超大模型时代,专家普遍认为,在封闭、 静态和确定性环境中,该模型已经可以达到人类的决策水平。而 ChatGPT 模型基于 GPT-4优化,引入了新的算法——从人类反馈中强化学习(RLHF),在训练中,训练 师会对答案进行排序、打分或者给出高质量答案,令 ChatGPT 具备一定逻辑和常 识,成为现阶段全球所发布的功能最全面的 AI 模型,远超同类产品的智能化水平。
正由于“通过文本与人对话”这一特点,ChatGPT 获得了得天独厚更为灵活的使用功 能。以前也曾有其他 AI 聊天机器人,但没有一款能与 ChatGPT 相提并论。ChatGPT 能进行天马行空的长对话,可以回答问题,还能根据人们的要求撰写各种书面材 料,例如商业计划书、广告宣传材料、诗歌、笑话、计算机代码和电影剧本等。
正是由于 ChatGPT 优秀的使用体验,使得其用户量获得了快速增长,发布短短 5 天,其用户数就超过 100 万,而 Facebook 获得 100 万用户,则用了整整 10 个月。 2023 年 1 月,ChatGPT 的月活跃用户数预计已达 1 亿,成为历史上用户增长最快的 消费应用。相比之下,达到 1 亿月活跃用户数,TikTok 花了约 9 个月的时间, Instagram 则花了两年半。在高技术力、优质体验、巨大客户群的背景下,ChatGPT 背后的模型公司 OpenAI 开始对科技公司产生巨大的冲击,而首当其冲的就是搜索领 域的各大巨头。 在 ChatGPT 发布的第一天,就有生成式 AI 将取代搜索引擎的声音出现。ChatGPT 虽 然常常被用于信息查找,但它本质上属于 AIGC(人工智能生产内容),是一种文本 创造方式;而搜索引擎的思路是信息查找与整合,无法创造文本。也正由于这一特 点,ChatGPT 能够给出更加“人性化”的交互问答服务。
ChatGPT 相对于传统搜索引擎具有难以替代的优势。输入端,ChatGPT 能够通过文本 对话的方式与用户进行深入交流,从而更加明确用户需求,给出恰当的回复;相较 之下,用户使用传统搜索引擎只能通过反复修改搜索关键词进行深入查找,过程繁 复,且常常很难得到满意的回复。输出端,ChatGPT 更贴近“人性化”的输出,通过 生成文本的方式模拟对话给出确定的答案;传统搜索引擎更贴近“搜索”,只能给出 大量网站链接,需要用户自行甄别信息。 这就使得,ChatGPT 可能对搜索带来一个重大变化:用户将会转向聊天机器人寻求 帮助,而不是通过谷歌提供的网站进行过滤。ChatGPT 有可能改变用户的搜索方 式。与用户在搜索引擎(谷歌)中尝试许多不同的搜索词并查看结果列表(和广 告)不同,大型语言模型可以做不同的事情。用户可以用正常的句子问语言模型一 个问题,它可以用一段漂亮的文字进行总结,并提供使用过的源网页链接。这种方 法的优点是用户不再需要阅读长长的结果列表,可预计在搜索领域,ChatGPT 带来 了一个破坏性创新,有望颠覆整个搜索领域的商业模式。
根据 Statcounter,截止 2023.01,谷歌在搜索引擎市场的市占率达到了 92.09%,但 是,一旦 ChatGPT 对“搜索”这一行为所带来的破坏性创新不断被用户接受,未来可 能用户都不会再去使用“搜索引擎”去进行“搜索”这一行为了,就类似马车被汽车替 换一样,虽然初期汽车不如马车,但是随着不断完善,汽车将最终替代马车,即使 某家公司在马车领域市占率再高,但是马车市场的空间将不断缩减直至最终消失。 对于谷歌来说,即使在搜索引擎领域,谷歌的市占率再高,但是如果 ChatGPT 使得 整个搜索引擎市场的流量将不断下降,这对于 2022Q4 广告营收(主要来源于巨大 流量)占比高达 78%的 Alphabet 来说,将会带来巨大的冲击。
同时,从技术上来讲,ChatGPT 也可能会降低搜索引擎的门槛。谷歌搜索分很多 层,从最开始的用户关键词输入到最后的信息提取,中间有一步叫做用户的关键词 改写,因为用户的关键词可能是比较模糊,改写就能够把这个关键词变得更清楚, 然后变成一个更加方便去提取信息的方式。如果中间的这一层让各个搜索公司自己 管理,但是这些中间层最后都指向 ChatGPT,那么搜索引擎这一个业务的门槛就会 降低,任何一个想做搜索的公司都可以基于 ChatGPT 开发自己的搜索引擎。 从 Alphabet 目前的反应来看,也能看出 ChatGPT 对于谷歌造成的冲击。在围绕谷歌 AI 战略的会议中,谷歌 CEO 桑达尔·皮查伊要求公司重新集中精力解决 ChatGPT 对其 搜索引擎业务构成的威胁。近日,有消息称,谷歌正在测试一款类似 ChatGPT 的聊 天机器人 Apprentice Bard,该产品基于谷歌对话模型 LaMDA,员工可以向其提问并 获得类似 ChatGPT 的详细答案。据悉,即便近期刚发生的事,Apprentice Bard 也能 回答出来。
2 月 2 日,桑达尔·皮查更是表示,该公司很快将在其搜索引擎中添加高级人工智能 功能。他预计,谷歌将在“未来几周或几个月”推出类似 ChatGPT 的基于人工智能的 大型语言模型。皮查伊在财报电话会议上透露,用户很快就能以“搜索伴侣”的形式 使用语言模型。他说,“很快,人们将能够直接与我们最新、最强大的语言模型互 动,作为搜索的伴侣,以实验和创新的方式。”“人工智能是我们目前正在研究的最 深刻的技术。我们的人工智能之旅才刚刚开始,最好的还在后面。”他补充说。 谷歌更是早在 2022 年 12 月就发布了“红色代码”,以紧急应对 ChatGPT 的崛起所带 来的威胁。谷歌也正在要求员工测试 ChatGPT 的竞争对手,作为“红色代码”计划的 一部分。 而中国的百度,同样也意识到了 ChatGPT 所带来的巨大挑战。
从 MaaS 整个的产业结构来看,核心应该是“模型→单点工具→应用场景”这样一个路 径。 以 ChatGPT 为例,其所用的底层模型就是 GPT-4,而产生出的单点工具就是 ChatGPT,最终 ChatGPT 又能落地在对话、撰写书面材料、修改代码等多个细分的应 用场景。
4.1 大模型,MaaS 的最重要基座
通过这三大模型系统,其他公司可以通过调用 API 实现自身 AI 产品的创造。以 DALL·E 为例,开发人员可以通过 OpenAI 的 API 将 DALL·E 直接集成到他们的应用程序 和产品中。超过 300 万人已经在使用 DALL·E 来扩展他们的创造力并加快他们的工作 流程,每天生成超过 400 万张图像。开发人员可以在几分钟内开始使用相同的技术 进行构建自己的产品。 又例如商汤科技,旗下的 AIDC 就是商汤的大模型。在 WAIC 2022 上,商汤在 AI 大 装置基础上衍生出四大平台体系:大装置 AI 云、车路协同、游戏、未来医院。 SenseCore 商汤大装置 AI 云是基于 AI 大装置的一套开箱即用的工业级 AI 工具链,而 另外三大平台可以理解为商汤“裁剪”出的行业大模型。大装置 AI 云无需前期投入, 从工业 AI 流水线到大模型训练、验证、推理,它都能成倍提高研发效率,基础设施 费用就大大降低。
4.2 单点工具,大模型应用的补充
单点工具往往是基于大模型产生的能实际应用的产品,例如 ChatGPT,它就是在 GPT-3.5 模型的基础上,产生出的能“对话”的 AI 系统。 除了 ChatGPT 以外,也有许多类似的单点工具存在,例如 Jasper,其是一个内容写 作工具,它使用人工智能为用户编写内容。它基于开源的 GPT-3 模型(同样为 OpenAI 出品),Jasper 声称可以创造 100%的原创内容,还整合了著名的原创检测的 工具 Copyscape。它也可以帮助重写用户不满意的段落,或纠正用户的语法。
又例如商汤科技基于自身“大装置+大模型”推出的 OpenXRLab 扩展现实平台,也是 一个单点工具。 该平台拥有领先算法,结合大量真人动作数据,商汤打造了一套基于深度学习的动 作捕捉及生成解决方案。该方案适配性强、自由度高、易于部署、无需绿幕和专业 动捕设备,即可高效率、低成本地实现 AIGC 内容生成。即便在日常直播等低算力设 备应用场景,也可进行流畅、高精度的视频创作和实时互动。该方案还可配套提供 用于虚拟 IP 生成的大规模、高质量、语义化的 3D 动作库,供企业进行数字人相关 的自主高效创作,从而满足企业在虚拟 IP 内容定制、直播运营等活动中的广泛需 求。结合企业品牌符号、标签等元素,商汤“虚拟 IP 解决方案”可智能生成符合品牌 性格和调性的专属形象,让品牌形象更年轻、更鲜活、更具辨识度和记忆点,打破 刻板印象,拉近与用户的距离。
4.3 应用场景,大模型应用的变现
虽说目前仍没有出现适合所有应用场景的“全能共通性”模型,但是单个大模型覆盖 的应用场景仍在持续扩展。 以商汤科技的“书生”大模型为例,一个“书生”基模型即可全面覆盖分类、目标检 测、语义分割、深度估计四大视觉核心任务。在 ImageNet 等 26 个最具代表性的下 游场景中,书生模型广泛展现了很强的通用性,显著提升了这些视觉场景中长尾小 样本设定下的性能。
又例如 GPT 模型系列,该模型本身是一种基于互联网可用数据训练的文本生成深度 学习模型,但是该模型的产品,如 ChatGPT、Jasper 等,目前应用场景却持续扩展。 例如,Jasper 虽然是文本书写工具,但是内置了 50 多个模板,适用于广告,博客, 电商,邮件,SEO,视频,网站等多种使用场景。而 ChatGPT 作为对话式 AI 程序, 其使用范围目前更是得到了很大的扩展,修改代码、撰写文字、搜索资源等等,已 经成为了重要生产力工具之一。 可以预见,随着未来大模型的发展持续进行,大模型以及其产生的产品的应用场景 将会持续扩展。
5.1 订阅制收费
此前推出的 ChatGPT 版本被 OpenAI 称为 Research Preview Launch(研究预览版)。 ChatGPT 推出一周,即收获 100 万注册用户,2023 年 1 月,ChatGPT 的活跃用户数 或已达 1 亿,它可能是史上增长最快的消费者应用,但这也导致了许多问题,上线 首周 ChatGPT 就多次因用户访问量过大导致服务器崩溃。此后为了应对访问量过大 而导致的服务器压力,OpenAI 对 ChatGPT 进行了大规模限流,包括禁止来自云服务 器的访问,限制每小时的提问数量,以及高峰时段排队等举措。可以看出, ChatGPT Plus 有效的改善了目前免费版面临的诸多痛点。 OpenAI 在声明中表示,ChatGPT Plus 将在未来几周率先在美国推出,之后尽快推行 至其他国家。公司表示,有兴趣的用户可以注册 ChatGPT Plus 的等待名单,未来几 周会发出邀请。
目前 ChatGPT 已经成为一款重要的生产力工具,被广大用户证明,可以写文案、写 小说,写代码、改 bug、查资料,还能帮忙对资料进行归纳总结。所以,收费版的 ChatGPT Plus 的确拥有广泛的市场空间。我们可以做一个简单的计算,假设在目前 的 1 亿用户中,有 30%愿意付费,按照年付费 240 美元计算,年收费就能达到 72 亿 美元,如果未来 ChatGPT 作为能够对标 office 的生产工具,付费用户数突破 10 亿 人,市场将达到 2000 亿美元以上,而且这还仅仅是按照目前 20 美元一个月的收费 来计算的,并没有考虑未来公司可能推出更高价格的订阅计划等,而如果加上未来 可能存在的广告等盈利方法,整个市场空间将会更加广阔。 其实,就在之前,有网友就发现 OpenAI 似乎在内测另一付费版 ChatGPT—— “ChatGPT Pro”,而这一计划的收费更是高达每月 42 美元。虽然这一计划最终未能正 式发布,但是也不排除未来 OpenAI 针对 ChatGPT 推出更多价位的不同计划。
而除了 ChatGPT,其他 MaaS 公司同样推出了许多商业订阅计划。以类似的 AI 聊天 公司 Jasper 为例,该公司产品 Jasper 以 GPT-3(同样为 OpenAI 产品,但已经开源) 为基座,通过在底层调用 GPT-3 模型研发出属于自己的文本生成 AI 模型,并推出了 多项订阅服务。 其中,订阅服务的收费主要分为三档:Starter 档的收费标准 29 美元月起,更为常用 的 Boss Mode 会员则是 59 美元/月起,另外还有更高昂的企业级收费。
即使是 59 美元/月的 Boss Mode 最基础档,其也只提供 5 万字/月的服务,对比 ChatGPT 不限量的生成字数,我们认为,ChatGPT 这类产品的订阅收费未来的天花板 远不止 20 美元,这背后自然是更为广阔的蓝海市场。
5.2 嵌入其他产品获得引流式收入
而除了模型本身进行订阅收费以外,MaaS 目前也在积极尝试其他各类收费模式。 例如,2 月 1 日,微软也宣布推出其视频会议及远程协作平台的高级付费版 Microsoft Teams Premium,这项高级服务将在 6 月份每月收费 7 美元,然后在 7 月 份恢复到正常的 10 美元。 订阅者可享用由 OpenAI GPT-3.5(支撑 ChatGPT 的底层模型)提供支持的大型语言 模型技术,即“智能回顾(Intelligent Recap)”这一重要功能,该功能将提供自动生 成的会议记录、推荐任务和个性化标亮。
基于 OpenAI 的 GPT-3.5 模型,即使用户没有参加会议,「智能回顾」也能生成会议 记录和要点。当会议在尴尬的时间举行时,或者当员工在不同的时区以及不在办公 室时,这项功能使紧张的工作变得更容易了。笔记、提到的内容和完整的文字记录 都是可用的,每个发言者的贡献都会在一个整齐的主题和章节的时间轴上突出显 示。 如果有同事在会议中提到用户,用户还会得到个性化的时间线标记,以快速查看分 享和讨论的内容。虽然大多数智能回顾功能目前已经可以使用,但微软表示有些功 能要到 2023 年第二季度才会出现。 此外,2 月 2 日,微软旗下 Dynamics 365 产品线(ERP+CRM 程序)发布视频,宣布 旗下客户关系管理软件 Viva Sales 也将集成 OpenAI 的技术,通过人工智能帮助销售 人员完成许多繁杂且重复的文字工作。
利用 OpenAI 的 GPT-3.5 模型,Viva Sales 可以为电子邮件里客户的问题生成回复建 议。该产品在 Outlook 电子邮件客户端中提供了创建特定回复的选项。例如,销售 人员可以从“提供折扣”(Offer a discount)、“回复询问”(Reply to an inquiry)或“自 行创建”(Suggest your own)等选项中进行选择,然后人工智能将创建可使用的内 容。AI 程序从客户记录和 Office 电子邮件软件中提取数据,将它们用于生成个性化 文本、定价细节和促销信息的电子邮件。
虽然,GPT-3.5 并未在 Viva Sales 中作为单独的收费项目存在,但是 Viva Sales 作为 CRM 产品本身每月就收费 40 美元,假设有 1000 万客户是因为 GPT-3.5 而选购 Viva Sales,则代表 GPT-3.5 每年能够为微软带来 48 亿美元的收入。
5.3 不同的 Model 应对不同的客户需求和客户定价
仍以 OpenAI 为例,在推出 ChatGPT 以前,其主要收入来源于对外部客户开源自身大 模型,通过提供 API 接口调用来收费。 例如用于创建和编辑原始图像的 DALL·E 模型,就有大量对 AI 生成图像这一功能存在 需求的公司选择调用该模型制造自身的产品,如 Mixtiles,其是一家发展迅速的照片 创业公司,其利用 DALL·E API 来创建和构建能引起情感共鸣的艺术品(图片),通 过引导用户完成捕捉童年记忆、梦想目的地等的创作过程。
而 CALA 同样调用了 DALL.E 模型,但是 CALA 作为数字平台,将整个设计流程——从 产品构思一直到电子商务支持和订单履行统一到了一起,DALL.E 仅在这一流程中起 到了支持作用,使得 CALA 的智能工具允许用户从自然文本描述或上传的参考图像中 生成新的设计理念图。
可以看出,相较于 Mixtiles,CALA 对于 DALL.E 模型的应用更偏商业,对于细节的要 求也更高,那在这种情况下,CALA 和 Mixtiles 两者调用 DALL.E 模型的收费肯定是有 所不同的。
而这都是针对图像生成模型DALL.E,而文本生成模型的GPT-3,其收费肯定跟 DALL.E 又有许多的不同。又比如,前文提及的 Jasper 对于 GPT-3 的调用是需要收取费用 的,如果未来的 GPT-4 恢复对外商用,那么作为比 GPT-3 更强大的模型,相信其的 收费也会高于调用 GPT-3。 总结来说,不同的 Model 应对不同的客户需求和客户定价肯定也会有所不同,客户 的要求越高,使用的模型越好,那么大模型的收费也将会更高。
6.1 商汤科技:A2.0 时代的全球领导者
商汤科技拥有深厚的学术积累,并长期投入于原创技术研究,不断增强行业领先的 全栈式人工智能能力,涵盖感知智能、决策智能、智能内容生成和智能内容增强等 关键技术领域,同时包含 AI 芯片、AI 传感器及 AI 算力基础设施在内的关键能力。 此外,商汤前瞻性打造新型人工智能基础设施——SenseCore 商汤 AI 大装置,打通算 力、算法和平台,大幅降低人工智能生产要素价格,实现高效率、低成本、规模化 的 AI 创新和落地,进而打通商业价值闭环,解决长尾应用问题,推动人工智能进入 工业化发展阶段。商汤科技业务涵盖智慧商业、智慧城市、智慧生活、智能汽车四 大板块,相关产品与解决方案深受客户与合作伙伴好评。 近年来人工智能已经迈入到一个新的阶段,即现在正在进入一个超大模型的时代, 超大模型的训练 pipeline,需要相当大的算力支撑,而这恰恰是商汤的优势所在。 2022 年 1 月 24 日,商汤人工智能计算中心 AIDC 正式启动运营。AIDC 是 SenseCore 商汤 AI 大装置的重要算力基座,其设计峰值算力超过 3740 Petaflops,是亚洲最大的 人工智能计算中心之一。商汤人工智能计算中心 AIDC 配合商汤自研的资源管理和调 度框架,能够实现资源支持按需调用、动态伸缩,从而在模型训练中,支持不同优 先级训练任务的资源调度和资源抢占。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
详见报告原文。
精选报告来源:【未来智库】