中国移动通信集团福建有限公司泉州分公司
Published:2025
移动端阅览
吴韦力. 大模型轻量化部署框架及企业应用研究[J]. 2025, (8): 28-34.
DOI:
吴韦力. 大模型轻量化部署框架及企业应用研究[J]. 2025, (8): 28-34. DOI: 10.13992/j.cnki.tetas.2025.08.002.
针对大模型企业落地的高算力成本、数据安全与灵活性不足等问题,本文提出轻量化部署框架及企业应用方案。基于向量数据库与词嵌入技术构建知识库,只需原本10%的算力资源即可搭建相关大模型应用。设计安全网关混合调度机制,通过公有大模型实现语义理解,结合私有大模型本地化执行,保障数据安全;建立插件化框架支持多模型灵活替换,提升扩展性。该方案应用于智能客服、指标查询、经营分析、制度查询等场景,准确率超过85%,响应效率提升显著。研究表明,本框架为企业大模型应用提供了低成本、高安全、易扩展的技术路径,助力行业智能化转型。
孙雨生,曾俊皓.向量数据库及其应用研究[J].科技情报研究,2024(04).
董航,李慧芳,陈泱,徐雷,陶冶.大模型时代的隐私保护与内容安全[J].通信世界,2023(21).
杨望,王钰淇.ChatGPT的创新发展探索[J].国际金融,2023(09).
曾骏,王子威,于扬,文俊浩,高旻.自然语言处理领域中的词嵌入方法综述[J].计算机科学与探索,2024(01).
许林.基于Bert与Milvus的专利智能语义检索系统研究[J].中国发明与专利,2023(02).
门业堃,钱梦迪,于钊,滕景竹,陈少坤,颜旭.基于检索重排序模型的文本差异化研究[J].电测与仪表,2023(01).
0
Views
64
下载量
CSCD
Publicity Resources
Related Articles
Related Author
Related Institution