梁文锋参与著述!DeepSeek最新论文先容新机制 可使AI模子进一步降本增效
2025-02-232月18日,DeepSeek团队发布一篇论文先容了新的详确力机制NSA(Natively Sparse Attention,原生寥落详确力机制)。 NSA专为长文本磨真金不怕火与推理遐想,能讹诈动态分层寥落政策等体式,通过针对当代硬件的优化遐想,权臣优化传统AI模子在磨真金不怕火和推理流程中的发达,十分是升迁长高下文的推理技艺,在保证性能的同期升迁了推理速率,并有用裁汰了预磨真金不怕火资本。 DeepSeek创举东谈主梁文锋现身论文著述者之中,在作家排行中位列倒数第二。 其他筹谋东谈主员来自D