AI智能总结
2月18日,DeepSeek发布最新论文,通过针对现代硬件的优化设计,NSA在提升推理速度的同时降低预训练成本且不牺牲性能,在通用基准测试、长上下文任务以及基于指令的推理中,NSA的表现可媲美甚至超越全注意力模型。 面向长文本的工作场景有望加速实现AI赋能,建议关注: 1)办公场景:金山办公、合合信息、福昕软件、万 【民生计算机】DeepSeek发布最新论文NSA的“长文本平权”利好什么方向 2月18日,DeepSeek发布最新论文,通过针对现代硬件的优化设计,NSA在提升推理速度的同时降低预训练成本且不牺牲性能,在通用基准测试、长上下文任务以及基于指令的推理中,NSA的表现可媲美甚至超越全注意力模型。 面向长文本的工作场景有望加速实现AI赋能,建议关注: 1)办公场景:金山办公、合合信息、福昕软件、万兴科技(PDF)等; 2)政务IT:新点软件、广联达、太极股份等。 风险提示:技术落地不及预期,行业竞争加剧。