发布日期:2025-02-26 02:59 点击次数:158
RAG 系统的搭建与优化是一项弘远且复杂的系统工程,常常需要兼顾测试制定、检索调优、模子调优等盘曲要领🔥买球·(中国大陆)APP官方网站,繁琐的使命过程时常让东说念主无从下手。
近日,针对以上痛点,清华大学 THUNLP 团队联接东北大学 NEUIR、面壁智能及 9#AISoft 团队共同推出了 UltraRAG 框架,该框架校正了传统 RAG 系统的设立与竖立情势,极大镌汰了学习本钱和设立周期。
UltraRAG 不仅具备满足专科用户需求的"单反相机"级邃密化竖立材干,同期也提供访佛"卡片机"的一键式方便操作,让 RAG 系统的构建变得极简且高效。
更伏击的是,比较复杂竖立的 Llamaindex 等传统 RAG 框架,UltraRAG 愈加崇拜将模子适配到用户提供的常识库,灵验幸免在"模子选型"的反复纠结。
同期,其模块化假想又能为科研需求快速赋能,匡助盘问者在多种场景下目田组合、快速迭代。通过 UltraRAG,用户不错平缓完成从数据到模子的全过程科罚。
GitHub 地址可到文末领取。
零代码编程 WebUI 相沿,一键式系统化数据构建
UltraRAG 以其极简的WebUI行动中枢上风之一,即等于无编程提醒的用户,也能平缓完成模子的构建、推行与评测。
不管是快速开展实验,已经进行个性化定制,UltraRAG 均能提供直不雅且高效的相沿。该框架集成了多种预设使命流,用户可凭证具体需求生动采选最优旅途,无需编写繁琐代码,即可完成从数据处理到模子优化的全过程操作。
以下是操作演示:
UltraRAG 以自研的KBAlign、DDR等设施为中枢,提供 "一键式"数据构建,结合检索与生成模子的各类化微调战略,助力性能全面优化。
在数据构造方面,UltraRAG 笼罩从检索模子到生成模子的全过程数据构建决策,相沿基于用户导入的常识库自动生成推行数据,显赫扶助场景问答的成果与适配遵循。
在模子微调方面,UltraRAG 提供了完备的推行剧本,相沿Embedding 模子推行及LLM 的 DPO/SFT 微调,匡助用户基于数据构建更刚劲、更精确的模子。
UltraRAG 以自研的UltraRAG-Eval设施为中枢,交融针对灵验与盘曲信息的多阶段评估战略,显赫扶助模子评估的谨慎性,笼罩从检索模子到生成模子的多维评估盘算,相沿从全体到各要领的全面评估,确保模子各项性能盘算在内容行使中获取充分考据。
通过盘曲信息点锚定,UltraRAG 灵验增强评估的踏实性与可靠性,同期提供精确反应,助力设立者合手续优化模子与设施,进一步扶助系统的谨慎性与实用性。
UltraRAG 内置THUNLP-RAG 组自研设施偏激他前沿 RAG 工夫,相沿统共模块化的合手续探索与研发。UltraRAG 不仅是一个工夫框架,更是科研东说念主员与设立者的牛逼助手,助力用户在多种任务场景中高效寻优。
UltraRAG 内置探索工夫系列
UltraRAG 系列引入多项改动工夫,优化了检索增强生成中的常识适配、任务相宜和数据处理,扶助了系统的智能性和高效性。
UltraRAG-KBAlign:扶助大谈话模子自适须常识库的材干,优化常识检索与推理过程。2.4B 模子通过自标注达到 GPT-4o 的标注性能,并在多个实验中杰出 GPT-4o 本人。
UltraRAG-Embedding:出色的中英文检索材干,相沿长文本与稀薄检索,通行评测榜单 MTEB-Retrieval 上性能评分进步 BGE-M3 10%。
UltraRAG-Vis:提议了纯视觉的 RAG Pipeline,通过引入 VLMs 对文档进行编码,幸免了文档理解形成的信息丢失,比较传统 Text RAG Pipeline,部分任务在端到端性能上扶助 25-39%。
UltraRAG-Adaptive-Note:通过动态缅想科罚和信息会聚,扶助复杂问答任务中的解答质料。在 GPT-3.5-turbo、Llama3-8B、Qwen2-7B 等多个前沿模子上实验标明,自相宜地动态缅想科罚和信息会聚战略相较基础检索增强生成模子已毕 3%~13.9% 的性能扶助,况兼尤其擅所长理具有复杂信息检索需求的问题。
UltraRAG-DDR:基于可微调数据奖励 ( DDR ) 优化检索增强生成,扶助任务特定场景的系统性能。在 MiniCPM-2.4B、Llama3-8B 等多个前沿模子上实验标明,DDR 优化战略相较原始检索增强生成模子可已毕 7% 以上性能扶助。
UltraRAG-Eval:针对 RAG 场景假想的高效评测决策。通过极少种子文档,快速自动生成专科限制的 RAG 评测数据,并提供谨慎的模子启动评测盘算与设施。
Github 地址:
https://github.com/OpenBMB/UltraRAG
参考文件
https://arxiv.org/abs/2410.13509
Li, Xinze, Mei, Sen, Liu, Zhenghao, Yan, Yukun, Wang, Shuo, Yu, Shi, Zeng, Zheni, Chen, Hao, Yu, Ge, Liu, Zhiyuan, et al. ( 2024 ) . RAG-DDR: Optimizing Retrieval-Augmented Generation Using Differentiable Data Rewards. arXiv preprint arXiv:2410.13509.【ICLR 2025】
https://arxiv.org/abs/2410.10594
Yu, Shi, Tang, Chaoyue, Xu, Bokai, Cui, Junbo, Ran, Junhao, Yan, Yukun, Liu, Zhenghao, Wang, Shuo, Han, Xu, Liu, Zhiyuan, et al. ( 2024 ) . Visrag: Vision-based Retrieval-Augmented Generation on Multi-Modality Documents. arXiv preprint arXiv:2410.10594. 【ICLR 2025】
https://arxiv.org/abs/2410.08821
Wang, Ruobing, Zha, Daren, Yu, Shi, Zhao, Qingfei, Chen, Yuxuan, Wang, Yixuan, Wang, Shuo, Yan, Yukun, Liu, Zhenghao, Han, Xu, et al. ( 2024 ) . Retriever-and-Memory: Towards Adaptive Note-Enhanced Retrieval-Augmented Generation. arXiv preprint arXiv:2410.08821.
https://arxiv.org/abs/2411.14790
Zeng, Zheni, Chen, Yuxuan, Yu, Shi, Yan, Yukun, Liu, Zhenghao, Wang, Shuo, Han, Xu, Liu, Zhiyuan, Sun, Maosong. ( 2024 ) . KBAlign: Efficient Self Adaptation on Specific Knowledge Bases. arXiv preprint arXiv:2411.14790.
https://arxiv.org/abs/2408.01262
Zhu, K., Luo, Y., Xu, D., Wang, R., Yu, S., Wang, S., Yan, Y., Liu, Z., Han, X., Liu, Z., & others. ( 2024 ) . Rageval: Scenario specific rag evaluation dataset generation framework. arXiv preprint arXiv:2408.01262.
— 完 —
投稿请使命日发邮件到:
ai@qbitai.com
标题注明【投稿】,告诉咱们:
你是谁,从哪来,投稿内容
附上论文 / 表情主页联接,以及联系情势哦
咱们会(尽量)实时回答你
一键崇拜 � � 点亮星标
科技前沿发达逐日见
一键三连「点赞」「转发」「注重心」
迎接在指摘区留住你的念念法!🔥买球·(中国大陆)APP官方网站
Powered by 🔥买球·(中国大陆)APP官方网站 @2013-2022 RSS地图 HTML地图