文章浏览阅读3.3k次,点赞9次,收藏24次。深入浅出讲解GPT系列大模型(GPT-1、GPT-2、GPT-3)_gpt系列模型
AI大模型  ·  2025-05-14 13:36
生成式预训练变换器(Generative Pre-trained Transformer,GPT)是一种基于人工智能技术的语言模型,广泛应用于自然语言处理领域。GPT通过大规模语料库的预训练,学习语言的统计规律,并能够生成连贯、自然的文本。作为自然语言生成和理解的重要工具,GPT支持多种应用场景,如...
AI大模型  ·  2025-05-14 13:35
Claude AI 是由 Anthropic 公司开发的一款新一代 AI 助手,旨在成为更安全、更友好、更可靠的 AI 系统。它基于 Anthropic 对 AI 安全性的深入研究,并采用 “Constitutional AI” (宪法式 AI) 的训练方法,使其行为更符合人类价值观,并减少有害输出...
AI大模型  ·  2025-05-14 09:39
【持续更新】国内如何使用Claude(克劳德)?(6种可行方式). Contribute to claude-china/claude-zh development by creating an account on GitHub....
AI大模型  ·  2025-05-14 09:39
作者 | 邓咏仪 编辑 | 苏建勋 “OpenAI给整合行业探索、指明了一个方向,我们也从善如流,把原来搜索、AI领域积累的能力整合到大模型里。”360创始人周鸿祎表示。 6月13日,360集团(601360.SH)公司正式召开“360智脑大模型”应用发布会,发布认知型通用大模型“360智脑4.0”...
AI大模型  ·  2025-05-14 04:10
AI大模型  ·  2025-05-14 04:10
近日,360自研AI大模型360智脑7B参数升级版(360Zhinao2-7B)正式开源,现已上线Github开源社区可免费商用。该模型是继今年4月 360Zhinao1-7B 开源后的重要更新,模型各项能力得到全面提升,不仅大幅提升了中英文通用能力,还显著增强了模型的数学逻辑推理能力。模型在中文考...
文章浏览阅读2.9k次,点赞8次,收藏19次。在过去的几天里,人们对新发布的开放权重模型 DeepSeek-R1 [1] 着迷不已,尽管训练成本低得多,但其性能与 GPT-o1 相当。DeepSeek-R1 在复杂的推理任务中表现出色,包括数学、编码和科学推理。该模型充分利用测试时间计算来执行详细的...
AI大模型  ·  2025-05-13 18:43
关键词:Transformer;PLM;SLM;NLM;LLM;Galactica;OPT;OPT-IML;BLOOM;BLOOMZ;GLM;Reddit;H100;H800;A100;A800;MI200;MI250;LaMA;OpenAI;GQA;RMSNorm;...
AI大模型  ·  2025-05-13 13:57
留学,语言成绩是必要材料之一,并且在申请院校的进程中,语言成绩的高低直接影响着你最终能申请什么到水平的院校,下面外语频道小编为大家具体分享下“雅思必备词汇参考(五)”内容。1. metro /...
AI大模型  ·  2025-05-13 13:56