炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!
3月20-21日,华为中国合作伙伴大会2025在深圳举行。
会上,恒生正式发布光子大模型一体机DeepSeek版,基于昇腾800I A2推理服务器,一体机为金融机构提供了“开箱即用”的全栈式金融AI引擎,满足行业对于AI应用高效部署、安全可控算力底座以及业务数智化创新的需求,助力金融机构快速完成大模型的部署落地,加速行业数智化转型进程。
2025年开年,DeepSeek凭借“低成本+高性能+高开放度”的应用优势,为金融机构提供了更智能、更高效、更低成本的基础大模型底座。
但在实际接入DeepSeek的过程中,仍存在诸多挑战:算力选型困难、部署交付周期长、数据安全与隐私风险、缺乏标准化知识增强方案、应用效果需要持续优化等。
针对以上痛点,恒生联合华为昇腾,打造全栈国产化的光子大模型一体机DeepSeek版,提供了从底层算力资源池、模型服务平台、企业级知识库、智能体编排生态组件到系统交付和运维的全栈开放能力,覆盖模型调试、部署到运营全流程,有效降低大模型引入门槛,助力金融机构实现高性价比AI基建。
恒生光子大模型一体机DeepSeek版支持部署DeepSeek R1/V3满血版,在2台16卡昇腾推理服务器上可部署671B满血版DeepSeek,基于国产开源推理引擎MindIE实现高并发高吞吐性能,在金融行业最典型的4096tokens输入,1024tokens输出场景下,2台16卡昇腾推理服务器在满足单路输出10tokens/s体验下,可支持超过100路并发,同时满足了单路时延和高并发需求,性能领先业内标杆水平。
恒生光子大模型一体机内置100+通用模型(如:DeepSeek蒸馏版、Qwen、Llama、GPT、GLM、图像模型、音频模型、视频模型等),支持AI应用响应多样性请求,基于大模型MaaS平台实现多模型管理及智能调度,既满足对于要素提取、内容审核等离线任务场景,又可以满足长文本理解输出,多轮对话,复杂数据等特定业务生成场景。客户可以根据“场景+体验+成本”选择不同的模型底座。
一体机的软硬一体私有化部署模式,具备一站式交付、成本优化、合规风险控制等优势特点:
AI赋能:AI全栈套件的一站式交付,让交付周期缩短40%,同时提供知识运营、大模型训练和微调、AI应用开发支持等服务,陪伴客户快速实现AI应用落地,加速业务创新;
成本优化:通过软硬件协同优化与资源智能调度,减少算力冗余,缩短部署周期,助力金融机构轻资产投入高效转型;
风险控制:私有化部署确保机构数据全程在本地服务器处理,保障数据主权,内置知识安全合规管控和完善的知识生命周期管理,规避敏感信息外泄风险,推动知识安全有效的累积与共享。
值得一提的是,一体机提供的ai智能体编排服务,为金融机构提供通用任务AI智能体的定制开发支持服务,赋能广泛用户群体,推动“AI平权”。
此外,数据的质量对于大模型至关重要。恒生通过自主研发iKnow知识平台,提供知识入库支持服务,助力金融机构基于自身核心业务数据构建专属知识库,从而让大模型“更懂企业、更懂业务”,释放业务数据价值,提升AI服务质量。
恒生光子大模型一体机的全栈AI能力,真正打通了AI应用的“最后一公里”,可以帮助金融机构快速实现这些智能应用的开发与上线,实现降本增效和价值创造的建设目标。
目前,恒生已面向金融核心业务场景,推出投顾智能助手、投顾内容生成、岗前仿实战培训、智能投研助手、托管运营助手、内外智能审查助手、智能数据统计生成、代码自动生成、AI测试等智能应用。
当前,大模型技术正在逐步进入产业化应用阶段,以大模型一体机为代表的软硬协同解决方案已成为推动行业智能化升级的关键基础设施,助力大模型应用进入普惠阶段。未来,恒生也将继续携手国内优秀的算力厂商、大模型厂商,构建性能卓越、安全可控的AI底座,共建安全、高效、普惠的金融数智化新生态,为金融行业注入最前沿的科技能力。
还没有评论,来说两句吧...