通义千问-通义千问是阿里云推出的强大AI助手,具备多模态交互、长上下文理解和文档处理等多项新功能。它广泛应用于办公、学习、创意写作和编程等领域,旨在提升用户的工作和学习效率。通义千问以其智能化服务和便捷的使用体验,正在改变人们的生活方式。...
AI大模型  ·  2025-05-14 20:46
AI大模型  ·  2025-05-16 00:42
文章浏览阅读2.1k次,点赞25次,收藏18次。总之,Llama模型的发布不仅证明了开源模型在全球AI领域的重要性,也为AI的未来发展方向提供了新的视角和动力。通过持续的技术进步和社区驱动的创新,Llama有望继续推动全球AI技术的广泛应用和发展。_llama大模型架构详解...
文章浏览阅读4w次,点赞63次,收藏81次。在人工智能大模型蓬勃发展的当下,DeepSeek-R1系列大模型凭借其出色的性能和广泛的应用潜力,受到了众多开发者和研究人员的关注。该系列包含1.5B、7B、8B、14B、32B、70B、671B等不同版本,每个版本都有其独特之处。今天,我们就来深入探讨一...
AI大模型  ·  2025-05-16 01:17
文章浏览阅读827次,点赞25次,收藏15次。1、大模型概述2、大模型、人工智能与机器学习3、腾讯混元大模型简介4、混元大模型训练及调优5、混元大模型训练数据大模型(Large Models)通常是指参数规模庞大、计算能力强大的人工智能模型,尤其在自然语言处理(NLP)、计算机视觉(CV)等领域表现...
AI大模型  ·  2025-05-16 02:49
盘古大模型,是华为旗下的盘古系列AI大模型,包括NLP大模型、CV大模型、科学计算大模型。2024年4月25日,华为官宣将在6月21日-23日在东莞松山湖举行华为开发者大会(HDC 2024)。据悉,本届HDC上,盘古大模型5.0与HarmonyOS NEXT 鸿蒙星河版将首次同台亮相。6月21日,...
AI大模型  ·  2025-05-16 09:53
文章浏览阅读5.8k次,点赞34次,收藏50次。【04】LLaMA-Factory微调大模型——数据准备_llama-factory数据集格式
AI大模型  ·  2025-05-14 15:24
文章浏览阅读1.2w次,点赞48次,收藏82次。在使用LlamaFactory进行模型微调时,理解和合理设置各个参数至关重要。确保了输入序列的合理长度,优化了注意力机制的实现,和则通过低秩矩阵和权重更新比例来提高微调效率和效果,而和则进一步细化了模型的训练策略。通过这些参数设置,您可以在计算资源有限...
AI大模型  ·  2025-05-14 15:25
华为重磅发布!盘古大模型3.0来了,多家A股公司披露与盘古大模型合作情况
AI大模型  ·  2025-05-15 05:26
豆包AI是一个由字节跳动开发和运营的AI对话聊天机器人产品,目前已经上线网页版和移动端,支持手机号、抖音账号、Apple ID登录体验。豆包AI拥有多种功能,包括文生文、文生图、英语学习、写作助手等,…...
AI大模型  ·  2025-05-15 08:58
腾讯混元大模型助力《碧优蒂的世界》实现NPC从脚本转化“智能生命体”
AI大模型  ·  2025-05-16 02:49