chatgpt训练需要多少gpu

我要回答

我要提问

1人浏览 2025-05-19 20:51

chatGPT在线试用

新一代对话式人工智能，历史上增长最快的消费者应用程序

立即进入

共6个回答

最佳回答

窦欢朋达
2025-05-19

对于ChatGPT的训练，需要使用多个GPU来提高训练速度和效果。具体需要多少个GPU取决于训练模型的规模和所使用的训练算法。在早期的GPT模型中，如GPT2，一般使用8张GPU进行训练。这是因为GPT2模型比较大，参数量多，需要大量的计算资源来进行训练。而在GPT3模型中，由于模型更大，参数量更多，因此训练所需的GPU数量也更多，一般需要使用数十张甚至上百张GPU来进行训练。训练一个大规模的ChatGPT模型需要显著的计算资源，通常超出了个人计算机或单机服务器的能力。这样的训练通常在大型计算集群上进行，如云计算平台或专用的超级计算机等。还应注意到，训练所需的GPU数量不仅与模型的规模有关，还与训练时间的要求有关。如果时间要求较高，可以增加使用的GPU数量以加快训练速度。使用更多的GPU也会增加训练的成本和资源需求。选择合适的GPU数量需要综合考虑模型规模、训练时间和计算资源等因素。
吴明榕会
2025-05-19

百度文心一言是每日更新的一句古诗词，旨在激发读者的思考，增强文人文魂。我期待文心一言能够带给我更多美好的文学体验，更深刻的文化意境，以及更多有趣的历史故事。进入3月中旬，全球科技巨头再次竞相亮相大语言模型赛道。一周之内，开发出ChatGPT的美国初创公司OpenAI，对OpenAI投入巨资的科技巨头微软，以及中国互联网龙头企业百度，相继发布了在大语言模型（LLM）领域的最新动态。这也再次引发了全球对该领域的关注。当地时间3月14日，OpenAI公布了其大型语言模型的最新版本——GPT-4，它比GPT-3.5的问答质量和技术都有明显提升。3月16日下午，百度开启新一代大语言模型、生成式AI产品文心一言测试，从而成为第一家加入该赛道竞争的中国企业。在发布会现场，百度创始人、董事长兼首席执行官李彦宏通过问答的形式，展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成等五个使用场景。几个小时后，微软宣布，将把GPT-4接入Office全家桶，新名为“Microsoft 365 Copilot”。正如财经E法在2月17日发布的文章（OpenAI独家回应｜ChatGPT为何不向所有中国用户开放注册？）所述，中国内地和中国香港的手机号均无法注册ChatGPT账号。虽然OpenAI的应用程序编程接口（API）已向161个国家和地区开放，但不包括中国内地和中国香港。一方面，业界普遍关注，在AIGC（生成式人工智能）势不可挡的科技浪潮中，谁将成为下一个弄潮儿？另一方面，在中美科技竞合的敏感期，各方亦颇为关注百度迈出的第一步带来的涟漪，以及中国企业该如何应对。01“真的ready了吗？”3月16日，李彦宏身着白衬衫和运动鞋演讲。开场就直面疑问，“最近一段时间，很多朋友问我，为什么是你们真的ready了吗”？李彦宏的回答是，虽然百度已投入AI研究十多年，为发布文心一言做了充分准备，但“不能说完全ready了”，因为文心一言对标ChatGPT、甚至是GPT-4，门槛很高，还“有很多不完美的地方”。但他强调“一旦有了真实的人类反馈，文心一言的进步速度会非常快”。李彦宏解释，之所以选择当天发布，是因为市场有需求：客户和合作伙伴都希望能早一点用上最新最先进的大语言模型。如何理解李彦宏所言的“对标GPT-4的门槛很高”？当地时间3月14日，OpenAI公布了其大型语言模型的最新版本——GPT-4。GPT-4是大型的多模态模型，即能够接受图像和文本类型的输入。而GPT-3.5只能接受文本输入。在演示视频中，OpenAI总裁兼联合创始人格雷格·布罗克曼(Greg Brockman)用笔和纸画了一幅网站草图，并将图片输入GPT-4。仅1到2秒后，GPT-4就生成了网页代码，制作出了与草图高度相似的网站。根据OpenAI发布的实验数据， GPT-4模型相较前一代GPT-3.5已取得了巨大的进步，在许多专业测试中表现出超过绝大多数人类的水平。浙江大学国际联合商学院数字经济与金融创新研究中心联席主任盘和林认为，文心一言未来还有待全面开放来获得用户检验。无论是通过B端API还是直接向C端用户开放，用户体验口碑都是硬道理。当前ChatGPT没对中国用户开放，在国内市场，百度将获得先发优势。对OpenAI和百度的产品均做过测评的艾媒咨询CEO兼首席分析师张毅表示，GPT系列大模型，包括GPT-4与文心一言本质上都是同一类产品，只是它们各自的数据覆盖范畴和数据模型的积累长短不一。从短期看，OpenAI的产品准备时间相对更加充足，智能程度暂时领先一些。但是对文心一言而言，能在这么短的时间内训练出这样的一个产品，也是非常了不起的。张毅也对百度做出更好产品更有信心，他的理由是，从人工智能、大数据、大模型的人才储备来看，中国会更有优势。中央财经大学数字经济融合创新发展中心主任陈端则认为，与海外竞争对手相比，百度最大的优势是立足本土，构建了语言和文化层面理解的护城河。作为中国公司研发的大语言模型产品，文心一言的中文理解能力备受关注。重要原因是，此前很多评论人士认为，ChatGPT的中文问答能力不如英文问答能力强。李彦宏表示，作为扎根于中国市场的大语言模型，文心一言具备中文领域最先进的自然语言处理能力。在现场展示中，文心一言正确解释了成语“洛阳纸贵”的含义、“洛阳纸贵”对应的经济学理论，还用“洛阳纸贵”创作了一首藏头诗。李彦宏称，文心一言的训练数据包括：万亿级网页数据，数十亿的搜索数据和图片数据，百亿级的语音日均调用数据，以及5500亿事实的知识图谱等，这让百度在中文语言的处理上能够独一无二。受访专家也指出，由于汉语的特殊性，中国企业在研发大模型时面临的难度更大，但若突破了，也会在提供本土服务时，具备更大的优势。法国里昂商学院人工智能与商业分析教授丁文璿日前对媒体指出，语言对话模型训练，需要让机器对文字产生理解，英语比中文稍微容易一些。丁文璿解释，中国人工智能技术所处理的中文语言，大多都是象形词，而英文是解释性的，相较而言词语也并非特别丰富。上海交通大学约翰·霍普克罗夫特计算机科学中心助理教授林洲汉认为，未来大语言模型大概率会往多模态、交互式的方向发展，进一步将视觉、语音、强化学习等领域的技术综合进来。李彦宏也表示：“多模态是生成式AI一个明确的发展趋势。随着百度多模态统一大模型的能力增强，文心一言的多模态生成能力也会不断提升。”在多模态生成方面，李彦宏展示了文心一言生成文本、图片、音频和视频的能力。文心一言在现场用四川话朗读了一段内容，并根据文本生成了一段视频。但李彦宏透露，文心一言的视频生成成本较高，现阶段还未对所有用户开放，未来会逐步接入。李彦宏称，文心一言的训练数据包括：万亿级网页数据，数十亿的搜索数据和图片数据，百亿级的语音日均调用数据，以及5500亿事实的知识图谱等，这让百度在中文语言的处理上能够独一无二。受访专家也指出，由于汉语的特殊性，中国企业在研发大模型时面临的难度更大，但若突破了，也会在提供本土服务时，具备更大的优势。法国里昂商学院人工智能与商业分析教授丁文璿日前对媒体指出，语言对话模型训练，需要让机器对文字产生理解，英语比中文稍微容易一些。丁文璿解释，中国人工智能技术所处理的中文语言，大多都是象形词，而英文是解释性的，相较而言词语也并非特别丰富。上海交通大学约翰·霍普克罗夫特计算机科学中心助理教授林洲汉认为，未来大语言模型大概率会往多模态、交互式的方向发展，进一步将视觉、语音、强化学习等领域的技术综合进来。李彦宏也表示：“多模态是生成式AI一个明确的发展趋势。随着百度多模态统一大模型的能力增强，文心一言的多模态生成能力也会不断提升。”在多模态生成方面，李彦宏展示了文心一言生成文本、图片、音频和视频的能力。文心一言在现场用四川话朗读了一段内容，并根据文本生成了一段视频。但李彦宏透露，文心一言的视频生成成本较高，现阶段还未对所有用户开放，未来会逐步接入。发布会前后，百度的股价经历了大落大起。3月16日，港股百度盘中股价跌幅一度扩大超10%，报120.1港元。截至收盘，百度股价跌幅为6.36%，报125.1港元。但百度股价在美股势头强劲，当日百度美股开盘低开高走，振幅超7%。截至收盘，报138.16美元，涨幅为3.8%。3月17日，百度港股表现强势，盘中一度大涨超15%。截至当日收盘，百度港股涨幅为13.67%，报142.2港元。文心一言宣布开启邀请测试一小时内，排队申请文心一言企业版API调用服务测试的企业用户已达3万多家，申请产品测试网页多次被挤爆，百度智能云官网流量飙升百倍。文心一言的市场热度持续飙升，资本市场也给予了价值重估。张毅认为，这也代表了公众对大语言模型/生成式AI “既期待，又担忧，然后是希望”的心情。02谁都不能错过的科技革命“真的ready了吗？”并不仅针对百度，也是伴随此轮“ChatGPT”热潮以来，公众普遍的疑问。李彦宏观察到，从2021年开始，人工智能技术开始从“判别式”向“生成式”转变。创新工场董事长兼CEO李开复3月14日在一场趋势分享会上表示，AI 2.0时代的第一个现象级应用，就是以GPT-4为代表的AIGC，又称生成式AI（Generative AI）。李开复表示，AI2.0 是绝对不能错过的一次革命，它将会是一个巨大的平台性机会，这个机会将比移动互联网大十倍。他还表示，AI 2.0也是中国在AI领域的第一次平台角逐机会。受访专家普遍认为，此前全世界的AI企业都遇到了一个极大的问题：即使技术储备十分丰富，AI应用并没有给它们带来丰厚的收益。造成这一问题的原因在于，AI产品的应用主要集中在B端（企业用户）和G端（政府用户），AI产品在进入企业或机构时往往流程复杂，这在某种程度上会限制AI产品在市场上的快速扩张。张毅认为，AIGC的产品应用方向在C端更有可能产生巨大的商业机会。他分析说，在美国市场，此前C端市场被谷歌、亚马逊、Meta等企业抢占，让微软压力非常大，更需要一款产品来扳回一局。在中国市场，百度的优势和谷歌一样，都有强大的搜索引擎对数据的抓取能力，以及储存、整理、分析能力的基础。中国本身拥有十几亿人口的巨大市场，百度完全可以做得很优秀。“百度和微软、谷歌本质上是两个不同市场的竞争，所以我相信文心一言以及系列产品也一定会跑出来。”张毅说。李彦宏坚称，文心一言不是“中美科技对抗的工具”。但他也承认，ChatGPT 的成功，加快了百度推出该产品的进度。百度CTO王海峰表示，人类进入AI时代，IT技术的技术栈可以分为四层：芯片层、框架层、模型层和应用层。百度是全球为数不多、在这四层进行全栈布局的人工智能公司，在各个层面都有领先业界的自研技术。高端芯片昆仑芯、飞桨深度学习框架、文心预训练大模型以及搜索、智能云、自动驾驶、小度等应用。王海峰认为，百度全栈布局的优势在于，可以在技术栈的四层架构中，实现端到端优化，大幅提升效率。文心一言与ChatGPT一样，都使用了SFT（模型微调）、RLHF（从人类反馈中进行强化学习）以及Prompt（提示）作为底层技术。文心一言还采用了知识增强、检索增强和对话增强技术。王海峰表示，这三项是百度已有技术优势的再创新。陈端认为，在当前技术创新的集成性越来越高的当下，全栈式布局的单一公司在内部技术研发统筹能力和后期商业化进行中的协同能力上具有比较优势。信心很重要，但差距无法忽视。在本月初的两会期间，中国科技部部长王志刚在回应ChatGPT相关的问题时，用足球打比方，指出中国还有很多工作要做。“踢足球都是盘带、射门，但是要做到梅西（足坛巨星利昂内尔·梅西）那么好也不容易。”王志刚指出，中国在这方面也作了很多布局，在该领域的研究也进行了很多年，并且有一些成果，“但目前要达到像 OpenAI 的效果可能还要拭目以待”他补充道。王志刚说，ChatGPT出来以后，引起了大家的关注。实际从技术本身源头来讲，它叫做NLP、NLU，也就是自然语言处理和自然语言理解。ChatGPT之所以引起关注，在于它作为一个大模型，有效结合了大数据、大算力、强算法，计算方法有进步。同样一种原理，做得有区别。比如大家都能做出发动机，但质量是有不同的。无论是ChatGPT还是文心一言，其背后的大语言模型是核心竞争力。北京大学王选计算机研究所研究员赵东岩告诉财经E法，国内大模型在数据、训练方法和费用投入方面和OpenAI还有一定差距。一位科技系统人士则对财经E法指出，客观而言，中美目前在该领域的基础研究成果差距较大。这些基础研究成果包含自然语言处理（NLP）、数据库、GPU产品，“美国切断GPU芯片（的供应），（中国的）算力就跟不上”。大型算力的核心在于高性能GPU芯片。北京航空航天大学软件学院助理教授周号益告诉财经E法，在GPU芯片等计算硬件上，中国与国际的差距在十年左右，硬件水平会严重制约大语言模型以及科学计算类模型的发展。周号益认为，在技术和模型上，中国的科技公司与OpenAI并没有代差，差距仅在五年以内，在一些较小的技术领域差距只有2-3年。在数据采集方面，以GPT-3大模型为例，其训练的语料中中文只占5%，中国科技企业对中文语料的积累具有一定优势，因此极有可能在中文领域实现突破。03巨头下一步：构建生态对于以ChatGPT为代表的大语言模型赛道如何实现盈利，是各方公认的难题（ChatGPT爆火的冷思考：盈利难题与治理挑战）。开发出ChatGPT的OpenAI仍是一家亏损中的创业公司。而2023年1月，投资银行摩根士丹利（Morgan Stanley）的一份分析报告称，ChatGPT的一次回复成本大约是谷歌搜索查询平均成本的6倍-28倍。但腾讯研究院高级研究员曹建峰和经纬创投前副总裁庄明浩都认为，ChatGPT能带来多少盈利，并不是OpenAI关注的重点，重点是基于它的模型能长出什么样的服务和应用，从而构建起一个生态系统。“ChatGPT的发展需要一个产业生态，比如它和微软相关应用的融合就是很好的思路。”曹建峰说。当地时间3月15日，微软副总裁兼消费者首席营销官余瑟夫·梅迪发文表示，新版必应搜索引擎已经在 GPT-4 上运行。另据OpenAI披露，GPT-4是在微软Azure AI 超级计算机上进行训练的，并将基于Azure 的AI基础架构向世界各地的用户提供 GPT-4服务。谷歌则宣布开放其大语言模型PaLM的API接口，并推出面向开发者的工具MakerSuite。通过PaLM API 接口，开发者们可以将PaLM用于各种应用程序的开发。MakerSuite则可以让开发者快速对自己的想法进行原型设计，并且随着时间的推移，该工具将具有用于快速工程、合成数据生成和自定义模型调整的功能。微软迅速跟进。当地时间3月16日，微软宣布将把GPT-4接入Office全家桶。新功能名为“Microsoft 365 Copilot”。李彦宏则在发布会上表示，文心一言定位于人工智能基座型的赋能平台，将助力金融、能源、媒体、政务等千行百业的智能化变革。根据文心一言的邀请测试方案，3月16日起，首批用户可通过邀请测试码，在文心一言官网体验产品，后续将陆续开放给更多用户。百度智能云即将面向企业客户开放文心一言API接口调用服务。该服务于3月16日起开放预约。截至3月18日早11点，排队申请百度智能云文心一言企业版API调用服务器测试的企业用户增加到9万家，百度收到关于文心一言合作的咨询 6588条。陈端认为，这一轮的竞争，不仅是商业主体的竞争，实际上也是关乎下一轮国家数字竞争力的竞争。百度的当务之急不完全是技术层面的研发，也需要引领更多初创型企业、生态合作伙伴加盟生态阵营。在陈端看来，中国在构建生态系统上具有优势。陈端指出，中国的移动互联网经过多年发展，应用层生态化的配套创新已经非常成熟。应用层的很多中小微创业团队，在过去配合移动互联生态做了大量的局部、垂类场景端的创新，把过去的这种模式以及底层基础设施从移动互联迁移到大模型领域依然适用。04中小企业还有机会吗？面对大语言模型的浪潮，中国企业该如何抓住机遇，避免风险？布局ChatGPT的企业有两种类型：第一种是传统的互联网大公司，第二种是一些初创企业。陈端认为，目前市场上的初创公司已经错过了布局大模型的初始创业阶段。陈端分析说，重新打造生成式AI企业，跟时机、底层的生态支撑度，还有创始人自身的阅历、经验、视野、个人IP的自然调动能力都是息息相关的。大模型在前期的投入，不管是算力还是其他的成本，以及时间窗口都很重要。陈端表示，百度有能力把自己的其他的产品与文心一言协同，就像微软把Office与GPT-4协同推出Copilot，而“创业者单纯去拼大模型却没有配套生态，这是很成问题的”。张毅也认为，对于能够有资金、实力支撑的企业来讲，单独构建大模型产品可能会更受资本和创业者的青睐。但对于中小企业来讲，依托文心一言的开放平台去嫁接自己在细分领域的应用，也是一个不错的选择。因为要做出大语言模型，需要长时间，以及巨额资金的投入。OpenAI成功的背后，是微软多年来的巨额投入。美国时间2023年1月23日，微软宣布将对OpenAI进行为期数年、价值数以十亿计美元的投资。在2019年和2021年，微软曾向OpenAI两次投资。2019年的投资为10亿美元，而2021年的投资未公开金额。 AI公司“彩云科技”的创始人袁行远在接受36氪采访时指出，要想跑通一次100亿以上参数量的模型，至少要做到“千卡/月”这个级别，即：用1000张GPU卡，然后训练一个月。即使不用最先进的英伟达A100，按照一张GPU五万元的均价计算，1000张GPU意味着单月5000万的算力成本，这还没算上算法工程师的工资。“无论是哪家公司，都不可能靠突击几个月就能做出这样的大语言模型。”李彦宏在发布会上表示，深度学习、自然语言处理，需要多年的坚持和积累，没法速成。大模型训练堪称暴力美学，需要有大算力、大数据和大模型，每一次训练任务都耗资巨大。百度提供的数据显示，百度近十年累计研发投入超过 1000 亿元。2022 年百度核心研发费用 214.16 亿元，占百度核心收入比例达到 22.4%。但百度并未透露大模型研发在核心研发费用中的占比。李彦宏在发布会上表示，百度对文心一言的定位，是一个通用的赋能平台，金融、能源、媒体、政务等千行百业，都可以基于这个平台来实现智能化变革，实现效率提升，创造巨大的商业价值。李彦宏认为，大模型时代将产生三大产业机会，分别为新型云计算公司、进行行业模型精调的公司和基于大模型底座进行应用开发的公司，即应用服务提供商。李彦宏断言，对于大部分创业者和企业来说，真正的机会并不是从头开始做ChatGPT和文心一言这样的基础大模型，这很不现实，也不经济。基于通用大语言模型抢先开发重要的应用服务，这可能才是真正的机会。基于文本生成、图像生成、音频生成、视频生成、数字人、3D等场景，已经涌现出很多创业明星公司，可能就是未来的新巨头。“大模型、生成式AI最终的产品形态还不得而知，所以这条路注定是长跑，需要整个科技界在资本、研发、模式创新上密切、持续地跟跑。”张毅说。李开复认为，AI2.0会最先应用在能容错的领域，而毫无疑问最大的应用领域现在是内容创造。每个领域都可以把原有的App重写一次，创造出更赚钱的商业模式，最终AI2.0的生成能力会把成本降的几乎到0。
宗政婷琴凡
2025-05-19

2023伊始，先是开年毫末智行举办HAOMOAIDAY，放出自动驾驶行业最大智算中心，再有小鹏、理想新春全员信剑指城市导航辅助驾驶，随后是对话式AI大模型ChatGPT火遍全网，自动驾驶AI技术再次成为顶流。无论是自动驾驶的“进城”，还是ChatGPT的“进化”，其背后都是对数据、算力需求指数级增长的态势以及对大模型的训练。当需求上来了，智算中心作为自动驾驶的“新基建”也就被业界越来越多的提及。智算中心即智能计算中心，是基于人工智能理论，采用领先的AI计算架构，提供人工智能应用所需算力服务、数据服务和算法服务的公共算力新型基础设施，换句话说，智算中心其实是一个算力的供应和生产平台。那为什么有了它“自动辅助驾驶”就可以变为“自动驾驶”了？“降服”自动驾驶边际成本自动驾驶智算中心“专云专用”有人说，智算中心是自动驾驶发展的助推器，因为自动驾驶算法模型训练是机器学习的典型场景之一，其视觉检测、轨迹预测与行车规划等算法模型需要同时完成高并发的并行计算，对算力有着极高的需求，而智算为提高算法模型的成熟度提供了巨大的算力。在自动驾驶领域，说起智算中心，还得先提特斯拉。2017年，Transformer网络出现后，奠定了当前大模型领域主流的算法架构基础，随后，2020年，特斯拉将Transformer大模型引入自动驾驶领域中，是AI大模型应用于自动驾驶的开端。在这之后，特斯拉开始着手打造属于自己的AI计算中心——Dojo，总计使用了1.4万个英伟达的GPU来训练AI模型。为了进一步提升效率，特斯拉在2021年发布了自研的AI加速芯片D1，并计划将25个D1封装在一起组成一个训练模块（Training tile），然后再将训练模块组成一个机柜（Dojo ExaPOD）。最近一期的特斯拉AI DAY上，马斯克称将于2023年一季度部署完成特斯拉超级计算机群组ExaPOD。国内方面，2022年8月，小鹏汽车和阿里云合建了当时国内最大的自动驾驶智算中心“扶摇”，专门用于自动驾驶模型训练，算力规模达600PFLOPS，相当于每秒可以完成60亿亿次浮点运算。不过这个记录仅仅维持了4个多月。今年1月，毫末智行联合火山引擎，共同推出自动驾驶行业最大的智算中心MANA OASIS（雪湖·绿洲），每秒浮点运算达67亿亿次，存储带宽每秒2T，通信带宽每秒800G。吉利也在1月28日上线了吉利星睿智算中心，目前已接入智能驾驶和车联网实验数据近百PB，在线车辆的并发计算支持达百万辆。从现有情形来看，成本和需求两重因素，是智算中心的诱人之处。成本层面，算力作为自动驾驶的基本要素，需要更高性能的智算中心来完成训练、标注等工作。以毫末的MANA OASIS为例，通过部署Lego高性能算子库、ByteCCL通信优化能力，以及大模型训练框架，软硬一体，毫末把算力优化到极致。在训练效率方面，基于Sparse MoE，通过跨机共享，轻松完成千亿参数大模型训练，且百万个clips（毫末视频最小标注单位）训练成本只需百卡周级别，训练成本降低100倍。搭建高效、低成本的数据智能体系是自动驾驶技术健康发展的基础，也是自动驾驶系统能够不断迭代前行的重要环节，更是自动驾驶商业化闭环的关键所在。小鹏汽车董事长何小鹏曾表态，“如果现在不以这样的方式（智算中心）提前储备算力，那么今后5年内，企业算力成本会从亿级，加到数十亿级。”如果持续使用公有云服务，边际成本不断上涨只是一方面，更重要的是，智算中心可以让自动驾驶企业实现“专云专用”。自动驾驶的开发包括从数据采集到数据筛选、打标、模型训练、回放性验证、仿真测试等等环节。而云计算的本质是租赁计算设备，云服务商的设备都是统一采购，为了获得更多客户，这些设备都具备很大的通用性，设备内部使用的CPU、GPU/AI加速器、内存的型号与规格都相对固定，很难与车企和自动驾驶公司的算法形成最佳匹配。云服务厂商对自动驾驶算法的了解程度不高，不可避免的会在调度算力时出现损耗和效率不高的问题。从需求的角度来看，智算中心似乎可以成为自动驾驶和车企的托底神器。同样以毫末为例，有了MANA OASIS的加持，毫末MANA五大模型全新亮相升级，车端感知架构实现跨代升级，毫末的技术栈布局继续保持完整领先的态势，尤其在感知、认知等层面领跑行业，引领大模型、大算力、大数据发展方向，冲刺进入自动驾驶3.0时代。拿数据采集、筛选和标注来说，自动驾驶系统在前期开发阶段，需要采集大量的道路环境数据，以此让车辆像人类驾驶员一样快速准确地识别车道、行人、障碍物等驾驶环境中的关键信息。唯一的办法是，通过在海量数据基础上不断的重复训练与验证，车辆对道路环境的认知水平逐渐趋近于真实情景，判断的准确性在这一过程中不断提升。车企收集到的数据还需要进行模型训练，算法通过在数据上进行运算产生模型，而智算中心将是驱动大模型和海量数据训练的加速器。基于Sparse MoE，毫末根据计算特点，进行稀疏激活，提高计算效率，实现单机8卡就能训练百亿参数大模型的效果，实现跨机共享exper的方法，完成千亿参数规模大模型的训练，训练成本降低到百卡周级别；毫末设计并实现了业界领先的多任务并行训练系统，能同时处理图片、点云、结构化文本等多种模态的信息，既保证了模型的稀疏性、又提升了计算效率；MANA OASIS训练效率提升了100倍。毫末智行CEO顾维灏也在详细阐释了建设智算中心的底层逻辑：“自动驾驶对智算中心的第一要求肯定是算力。智算中心的超大算力代表了有多少的AI工程师在这个练武场中能够做出什么大模型，能训练多少大模型。”智能辅助驾驶“进城” MANA OASIS帮助毫末解决了哪些难题？现在很多车企和自动驾驶技术企业已经开始把打造智算中心当成下一阶段竞争重点。今年1月的HAOMO AI DAY上，毫末智行董事长张凯给出了2023年自动驾驶行业趋势的十大新预测，超算中心赫然位列“超算中心会成为自动驾驶企业的入门配置。”当下，随着新能源汽车品牌普遍已经把高速公路场景下的辅助驾驶列为标配，赛场已经悄然从高速路转向城市。与高速导航辅助驾驶相比，城市行车涉及了红绿灯、十字路口、行人电动车、遮挡、固定障碍物、频繁刹停起步等一系列难题，复杂度又提升了好几个数量级。如果仅用实测车辆去挑战这些城市场景无法穷尽的Corner Case，成本、安全性、时间都将成为企业发展的壁垒。由此，虚拟仿真就成为了解决部分成本及场景多样性的关键，大规模的长尾场景需要数据中心提供充足的算力支持。仿真场景对现实的回归过程，同样需要巨大的算力提供支持。在MANA OASIS的加持下，毫末的数据智能体系MANA五大模型全新亮相升级。而在五大模型助力下，MANA最新的车端感知架构，从过去分散的多个下游任务集成到了一起，形成一个更加端到端的架构，包括通用障碍物识别、局部路网、行为预测等任务，毫末车端感知架构实现了跨代升级。这也意味着毫末的感知能力更强，产品力更强，向全无人驾驶加速迈进。视觉自监督大模型，让毫末在中国首个实现4D Clip的自动标注。毫末利用海量videoclip，通过视频自监督方式，预训练出一个大模型，用少量人工标注好的clip数据进行Finetune（微调），训练检测跟踪模型，使得模型具备自动标注的能力；将已经标注好的千万级单帧数据所对应的原始视频提取出来组织成clip，其中10%是标注帧，90%是未标注帧，再将这些clip输入到模型，完成对90%未标注帧的自动标注，进而实现所有单帧标注向clip标注的100%的自动转化，同时降低98%的clip标注成本。毫末视频自监督大模型的泛化性效果极佳，即使是在一些非常困难的场景，例如严重遮挡的骑行者，远处的小目标，恶劣的天气和光照，都能准确地完成自动标注。3D重建大模型，助力毫末做数据生成，用更低成本解决数据分布问题，提升感知效果。面对“完全从真实数据中积累corner case困难且昂贵”的行业难题，毫末将NeRF技术应用在自动驾驶场景重建和数据生成中，它通过改变视角、光照、纹理材质的方法，生成高真实感数据，实现以低成本获取normal case，生成各种高成本corner case。3D重建大模型生成的数据，不仅比传统的人工显式建模再渲染纹理的方法效果更好、成本更低。增加NeRF生成的数据后，还可将感知的错误率降低30%以上，且数据生成可实现全程自动化，无需任何人工参与。多模态互监督大模型则可以完成通用障碍物的识别。毫末在成功实现车道线和常见障碍物的精准检测后，针对城市多种异形障碍物的稳定检测问题，毫末正在思考和探索更加通用的解决方案。毫末的多模态互监督大模型，引入了激光雷达作为视觉监督信号，直接使用视频数据来推理场景的通用结构表达。该通用结构的检测，可以很好地补充已有的语义障碍物检测，有效提升自动驾驶系统在城市复杂工况下的通过率。动态环境大模型，可以精准预测道路的拓扑关系，让车辆始终行驶在正确的车道中。在重感知技术路线下，毫末为了将对高精地图的依赖度降到最低，面临着“道路拓扑结构实时推断”的挑战。毫末在BEV的feature map（特征图）基础上，以标精地图作为引导信息，使用自回归编解码网络，将BEV特征，解码为结构化的拓扑点序列，实现车道拓扑预测。让毫末的感知能力，能像人类一样在标准地图的导航提示下，就可以实现对道路拓扑结构的实时推断。毫末认为，解决了路口问题实际就解决了大部分城市NOH问题。目前在保定、北京，毫末对于85%的路口的拓扑推断准确率高达95%。即便是非常复杂、非常不规则的路口，毫末也能准确预测，比老司机还老司机。人驾自监督认知大模型在今年2月已经被正式升级为DriveGPT，这也是全球首个自动驾驶认知大模型。它能让毫末的驾驶策略更加拟人化，安全及顺畅。毫末DriveGPT已完成模型搭建和第一阶段数据的跑通，参数规模可对标GPT-2的水平。DriveGPT将持续引入大规模真实接管数据，通过人驾数据反馈的强化学习，来不断提升测评效果，同时也将DriveGPT作为云端测评模型，用来评估车端小模型的驾驶效果。仿真测试能有效缩短技术和产品开发周期，降低研发成本。业内典型的长尾场景问题不够丰富，现实中可遇而不可求的极端场景，利用仿真平台可以便捷生成。由于仿真测试中的模拟环境需要实现多模态融合，以支持传感器模组的复杂性，因而也需要大算力的支持。除了毫末，特斯拉超算中心拥有近2万张GPU，对自动驾驶训练效率产生立竿见影的效果，最大限度地提升了自动驾驶系统的开发效率；大陆集团的高算力集群，将开发周期从几周缩短至几个小时，使自动驾驶得以在中短期商业计划中落实；机器学习时间的缩短加快了新科技进入市场的速度；“扶摇”支持小鹏自动驾驶核心模型的训练时长从7天缩短至1小时内，大幅提速近170倍……当前，一个不争的事实就是，在自动驾驶领域具有长期规划的车企，无论是造车新势力还是传统品牌，或者技术供应商，都在搭建自己的超算中心，以掌握稳定的算力资源，缩短开发周期，加快自动驾驶产品的上市。相反，如果没有超算中心，那么自动驾驶训练速度将明显放缓，自动驾驶企业间的差距也将愈发明显。用智算中心打造数据护城河数字新基建逐步成为发展“标配”自动驾驶发展至今，业界发现乘用车智能辅助驾驶是最有可能大规模铺开的商业场景。据高工智能汽车研究院数据显示，2022年中国市场（不含进出口）乘用车前装标配搭载L2级辅助驾驶的搭载率，已经连续第二个月超过30%。智研咨询数据显示，预计到2025年，全球新车L2自动驾驶的渗透率可达53.99％。今年，城市导航辅助驾驶也开启了量产的征程。西部证券预测，2023～2025年，国内市场上搭载城市导航辅助驾驶的车型将分别达到70万、169万和348万辆，占比将分别达到17％、40％和70％。在城市导航辅助驾驶落地加速的背景下，更容易复制、拓展的重感知的方案，受到了更多关注。在重感知技术路线下，面对“道路拓扑结构实时推断”的挑战，毫末的选择是在特征图基础上，以标精地图作为引导信息，使用自回归编解码网络，通过结构化的拓扑点序列解码，实现车道拓扑预测。由此不难看出，业界逐渐达成共识的重感知路线，相比高精地图方案，更依赖算力加持。人工智能是创新的加速器，智算中心则可以为各类技术创新提供支撑。一方面，智算中心可以为构建安全可信、可复用的技术研发环境提供算力设施支撑，为各领域科技研发提供智能计算服务，加速科技研发的进程；另一方面，智算中心是新一代信息技术的集成应用载体，智算中心的快速建设推广与规模化应用将推动通信服务网络、大数据、人工智能等技术的快速迭代，从而促进技术创新。自动驾驶数据是片段式的，特点是小文件多，达到百亿个，而且训练需要交换的数据多，智算中心可以提供充足的带宽，并且可以让自动驾驶模型拥有更好的并行计算框架，在训练的时候把硬件资源都利用起来。2020年4月20日，国家发展改革委首次明确新型基础设施的范围，其中就包括以智能计算中心为代表的算力基础设施。2023年1月10日，国家工业信息安全发展研究中心推出《智能计算中心2.0时代展望报告》，指出经过5年多发展，智算中心正由1.0粗放扩张阶段走向2.0精细规划阶段。根据相关统计和测算，目前全国超过30个城市在建或筹建智算中心，未来5年我国智能算力规模年复合增长率将达52.3%。智算中心的创新发展，将进一步为人工智能夯实“算力底座”，成为带动人工智能及相关产业快速发展的新引擎。“我们测算，智算中心带来的成本优化是惊人的，将达到亿元级别。”这是今年1月，张凯提出的预测。从目前及未来的规划量产规模来看，毫末自建智算中心可节约巨额成本；其带来的效率提升也非常明显。人工智能发展很快，新的算法层出不穷，需尽快引入新的技术和模型，与此数据是智能化发展最大的驱动力，也占据了大量成本构成。用自建智算中心来打造数据护城河，不仅能够完善产业智能生态，更能让企业在智能化方面占据先发优势，智算中心作为数字新基建，未来势必将引领自动驾驶技术持续迭代升级。【本文来自易车号作者车业视界，版权归作者所有,任何形式转载请联系作者。内容仅代表作者观点，与易车无关】
濮阳婉伯文
2025-05-19

1、要配置豹剪GPT，首先需要下载豹剪GPT的源代码，并准备好所有依赖项。 2、根据豹剪GPT的配置说明进行必要的配置，如设置模型路径、超参数等。 3、运行配置好的代码，即可开始使用豹剪GPT。豹剪GPT是一种基于变压器的自然语言处理（NLP）模型。为了配置豹剪GPT，需要进行以下几个步骤。确保您具有一个功能强大的计算机，具备高性能的图形处理单位（GPU），这样能够更快地训练模型。下载GPT的开源代码并将其安装在计算机上。下载预训练的GPT模型，并将其加载到您的计算机上。根据具体应用的要求，对模型进行微调和优化，以实现更好的性能和适应性。配置好豹剪GPT后，您就可以开始使用它来处理各种自然语言处理任务了。要配置豹剪GPT，首先需要确保你有一台支持GPT的计算机。你需要进入计算机的BIOS设置，将启动模式从Legacy改为UEFI。你可以使用磁盘管理工具，如Windows的磁盘管理器或第三方软件，来创建GPT分区。在创建分区时，你可以选择分区类型、大小和文件系统。你可以将操作系统安装到GPT分区上，并确保你的计算机能够正常引导到GPT分区。您需要下载和安装豹剪GPT的软件。您需要配置GPU环境。确保您的计算机上安装了适当的GPU驱动程序，并且您的GPU支持CUDA或者OpenCL。您需要获取豹剪GPT的许可证密钥，这可以在豹剪官方网站上获得。在安装和配置完软件和GPU环境之后，您可以打开豹剪GPT的控制台。在控制台中，您可以输入许可证密钥并登录。您可以根据您的需求设置模型的参数。您可以选择预训练的模型，例如中文GPT、英文GPT等。您还可以设置生成文本的最大长度、温度等参数。配置完成后，您可以使用豹剪GPT的API进行文本生成和处理。请注意，确保您的计算机资源足够支持豹剪GPT的运行，因为它需要大量的计算资源和存储空间。
景罡庆淑
2025-05-19

不烧这张显卡不出意外的话会是一张由某个国产品牌基于公版PCB推出的RTX 4070Ti。原因无他：在英伟达精湛的“产品定位”策略下，RTX 4070Ti可能是大多数游戏玩家现阶段唯一的选择。以TechEpiphany公布的德国市场销售数据为例，RTX 4070Ti的周销量已经超越了其主要竞争对手Radeon 7900XTX和7900XT周销量的总和，从这个角度看，RTX4070Ti也很有可能接棒RTX2060，成为新一代的“玩家之选”。烧显卡的。ChatGPT 成显卡熔炉，将吞 3 万颗高端 GPU，英伟达笑到最后据 Trendforce 报道，ChatGPT在一定条件下会烧显卡的。
邹腾哲谦
2025-05-19

GPT模型所需要的算力非常大，特别是最新的GPT-4模型。具体来说，运行该模型所需要的计算资源是一个非常昂贵的任务，通常需要使用高性能计算机群或云计算平台。只有一些大型科技公司或研究机构才可能拥有足够的资源来支持运行GPT模型。OpenAI在开发和训练GPT系列模型时使用了大量的GPU和TPU来加速训练和推理过程。据OpenAI官方公布的数据显示，训练一个GPT-3模型需要至少1750个V100 GPU，并且消耗的电力相当于平均美国家庭用电量的四倍左右。要运行GPT模型需要极其强大的算力，并且需要整合多种硬件和软件资源。