千问QwQ-32B本地一键部署:部分能力比肩DeepSeek-R1满血版 先放一个在线体验版,大家可以先用用看,觉得好用再考虑本地部署Qwen:https://chat.qwen.ai... 2025-03-0661 阅读
阿里重磅开源QwQ-32B模型:320亿参数媲美DeepSeek-R1,消费级显卡轻松部署 2025年3月6日,阿里巴巴正式开源了其全新推理模型通义千问QwQ-32B,以Apache 2.0协议向全球开发者开放。这款模型凭借320亿参数量,在数学推理、编程能力和通用任务中表现卓越,甚至能与参数量达6710亿... 2025-03-06133 阅读
Manus AI:全球首款通用型人工智能代理 Manus AI是由中国团队Monica.im研发的全球首款通用型人工智能代理(AI Agent),于2025年3月6日正式发布。该产品凭借“自主思考与执行能力”重新定义了AI助手的边界,被认为是继大模型之后AI领域... 2025-03-0672 阅读
智谱AI发布CogView4:免费开源的AI绘画神器,支持汉字生成! 2025年3月4日,国内AI领域迎来重磅消息——智谱AI正式推出新一代文生图模型CogView4!这款模型不仅支持中英文混合输入、生成高分辨率图像,还能直接在画面中“写汉字”,堪称广告设计、短视频创作的“生产力神器”... 2025-03-0565 阅读
DeepSeek开源周第三天:DeepGEMM DeepGEMM(Deep Gaussian Embedding Matrix Multiplication)是一种结合深度学习和矩阵运算优化的技术,旨在通过神经网络模型高效地近似复杂的矩阵乘法操作。它在减少计算开销... 2025-02-2683 阅读
DeepSeek发布开源MoE通信库DeepEP:高效优化多场景训练与推理 2025年2月25日,DeepSeek在开源周第二天发布了首个用于混合专家模型(MoE)训练和推理的开源专家并行通信库DeepEP,该项目的核心亮点包括:高效通信优化:DeepEP针对MoE模型的特性,优化了全对全(... 2025-02-2584 阅读
DeepSeek发布创新Flash MLA技术,显著提升大模型效率与性能 近日,深度求索(DeepSeek)团队宣布推出其最新研发的Flash Multi-Head Latent Attention(Flash MLA)技术,为自然语言处理领域带来了重大突破。这项技术创新性地优化了大语言模... 2025-02-2479 阅读
热文豆包AI网页版入口 豆包是由字节跳动推出的人工智能产品,目前处于不断发展和完善的阶段。网页版为用户提供了便捷的访问方式,无需下载安装即可使用。字节跳动在 2024 年推出了首个 AI 对话式 APP “豆包” 及其网页版,引起了广泛关注... 2024-11-268683 阅读