MerCry
7134ec3c5e
[AC-AISVC-RES-09~15] config: 将默认运行时模式改为 AUTO
...
- 修改 ModeRouterConfig.runtime_mode 默认值从 DIRECT 改为 AUTO
- 系统将根据查询复杂度和置信度自动决定使用 ReAct 模式还是通用 API 模式
- 短查询 + 高置信度 -> 使用 DIRECT 模式
- 复杂查询或低置信度 -> 使用 REACT 模式
2026-03-11 00:03:25 +08:00
MerCry
c628181623
[AC-AISVC-RES-01~15] feat(retrieval): 实现检索策略路由核心模块
...
- 新增 routing_config.py 路由配置模型
- StrategyType: DEFAULT/ENHANCED 策略类型
- RagRuntimeMode: DIRECT/REACT/AUTO 运行模式
- RoutingConfig: 路由配置类
- StrategyContext: 策略上下文
- StrategyResult: 策略结果
- 新增 strategy_router.py 策略路由器
- RollbackManager: 回滚管理器
- DefaultPipeline: 默认检索管道
- EnhancedPipeline: 增强检索管道
- StrategyRouter: 策略路由器
- 新增 mode_router.py 模式路由器
- ComplexityAnalyzer: 复杂度分析器
- ModeRouter: 模式路由器
- 新增 strategy_integration.py 统一集成层
- RetrievalStrategyIntegration: 策略集成器
- 更新 __init__.py 导出新模块
2026-03-10 21:07:01 +08:00
MerCry
7027097513
[AC-AISVC-RES-01~15] feat(retrieval): 实现检索策略Pipeline模块
...
- 新增策略配置模型 (config.py)
- GrayscaleConfig: 灰度发布配置
- ModeRouterConfig: 模式路由配置
- MetadataInferenceConfig: 元数据推断配置
- 新增 Pipeline 实现
- DefaultPipeline: 复用现有 OptimizedRetriever 逻辑
- EnhancedPipeline: Dense + Keyword + RRF 组合检索
- 新增路由器
- StrategyRouter: 策略路由器(default/enhanced)
- ModeRouter: 模式路由器(direct/react/auto)
- 新增 RollbackManager: 回退与审计管理器
- 新增 MetadataInferenceService: 元数据推断统一入口
- 新增单元测试 (51 passed)
2026-03-10 20:50:16 +08:00
MerCry
fe883cfff0
feat: update core backend services including LLM, embedding, KB, orchestrator and admin APIs [AC-AISVC-CORE]
2026-03-10 12:09:45 +08:00
MerCry
c4ad6eb8ce
feat: inject metadata filters and add fallback reason codes [AC-IDSMETA-18, AC-IDSMETA-19, AC-IDSMETA-20]
2026-03-02 22:15:58 +08:00
MerCry
6b21ba8351
feat(v0.7.0): 验收通过 - Dashboard统计增强、流程测试、对话追踪
...
验收通过的标准:
- AC-ASA-59~64: 前端话术流程和护栏监控功能验收
- AC-AISVC-91~95: Dashboard统计增强和完整流程测试验收
- AC-AISVC-108~110: 对话追踪和导出功能验收
修复问题:
- flow_test.py: 修复OrchestratorService导入和调用
- 前后端字段不一致: orderstep_no, wait_for_inputwait_input
- 数据库迁移: 添加chat_messages缺失的监控字段
新增文件:
- ai-service/app/api/admin/flow_test.py
- ai-service/scripts/migrations/add_chat_message_fields.py
- ai-service-admin/src/views/admin/prompt-template/components/VariableManager.vue
2026-02-28 12:52:50 +08:00
MerCry
d660c19ab9
feat: 添加嵌入配置持久化及模型切换警告 [AC-AISVC-50]
...
- 添加嵌入配置持久化到config/embedding_config.json
- 服务启动时自动加载保存的配置
- 切换模型时前端显示警告提示需要重新上传文档
- 修复OptimizedRetriever缓存问题,每次检索获取最新配置
- 清理调试用的Python临时文件
- 更新.gitignore忽略config目录
2026-02-26 18:01:03 +08:00
MerCry
fd04ed2cef
fix: 修复RAG检索多个问题并更新嵌入模型配置 [AC-AISVC-50]
...
主要修复:
1. 修复ConfigForm和EmbeddingConfigForm组件watch死循环导致内存溢出
2. 修复向量存储格式与检索格式不匹配问题
3. 修复两阶段检索和混合检索互斥问题
4. 修复RRF融合时vector字段丢失问题
5. 修复embedding_full未归一化导致相似度计算错误
6. 修复嵌入模型配置表单不显示参数问题
功能增强:
- 添加with_vectors参数支持返回向量用于重排序
- 新增两阶段+混合检索组合策略
- 更新README嵌入模型配置说明,推荐nomic-embed-text-v2-moe
- 添加cleanup_qdrant.py脚本用于清理向量数据
2026-02-26 14:45:21 +08:00
MerCry
97e7fd0992
feat: 添加API Key认证系统和修复Qdrant搜索问题 [AC-AISVC-50]
...
- 新增 API Key 数据库模型和服务
- 新增 ApiKeyMiddleware 认证中间件
- 新增 /admin/api-keys 管理接口
- 前端支持 VITE_APP_API_KEY 环境变量
- 修复 optimized_retriever.py 中 Qdrant 搜索调用方式
- 更新 Dockerfile 支持构建时传入 API Key
- 更新 docker-compose.yaml 支持前端 API Key 配置
2026-02-26 03:11:36 +08:00
MerCry
02f03a3a12
feat: RAG 配置优化与检索日志增强 [AC-AISVC-16, AC-AISVC-17]
2026-02-25 23:42:31 +08:00
MerCry
cee884d9a0
feat: RAG 检索优化,实现多维度向量存储和 Nomic 嵌入提供者 [AC-AISVC-16, AC-AISVC-29]
2026-02-25 23:10:12 +08:00
MerCry
c1d76093aa
feat(AISVC-T7): 嵌入模型可插拔设计与文档解析支持 [AC-AISVC-29, AC-AISVC-30, AC-AISVC-31, AC-AISVC-32, AC-AISVC-33, AC-AISVC-34, AC-AISVC-35, AC-AISVC-36, AC-AISVC-37, AC-AISVC-38, AC-AISVC-39, AC-AISVC-40, AC-AISVC-41]
...
- 新增 EmbeddingProvider 抽象基类和工厂模式 [AC-AISVC-29, AC-AISVC-30]
- 实现 OllamaEmbeddingProvider 和 OpenAIEmbeddingProvider [AC-AISVC-29, AC-AISVC-30]
- 新增 EmbeddingConfigManager 支持配置热更新 [AC-AISVC-31, AC-AISVC-32]
- 新增 DocumentParser 抽象接口和工厂类 [AC-AISVC-33]
- 实现 PDF/Word/Excel/Text 文档解析器 [AC-AISVC-33, AC-AISVC-34, AC-AISVC-35]
- 新增嵌入管理 API 端点 [AC-AISVC-38, AC-AISVC-39, AC-AISVC-40, AC-AISVC-41]
- 更新文档上传流程支持多格式文档解析 [AC-AISVC-36, AC-AISVC-37]
- 更新 OpenAPI 契约添加嵌入管理接口
- 添加数据库初始化脚本
- 更新规范文档标记 Phase 7 完成
2026-02-24 23:08:08 +08:00
MerCry
4b64a4dbf4
feat(AISVC-T6.9): 集成Ollama嵌入模型修复RAG检索问题
...
## 问题修复
- 替换假嵌入(SHA256 hash)为真实Ollama nomic-embed-text嵌入
- 修复Qdrant客户端版本不兼容导致score_threshold参数失效
- 降低默认分数阈值从0.7到0.3
## 新增文件
- ai-service/app/services/embedding/ollama_embedding.py
## 修改文件
- ai-service/app/api/admin/kb.py: 索引任务使用真实嵌入
- ai-service/app/core/config.py: 新增Ollama配置,向量维度改为768
- ai-service/app/core/qdrant_client.py: 移除score_threshold参数
- ai-service/app/services/retrieval/vector_retriever.py: 使用Ollama嵌入
2026-02-24 22:15:53 +08:00
MerCry
0a167d69f0
feat(ai-service): implement LLM Adapter for T3.1 [AC-AISVC-02, AC-AISVC-06]
...
- Add LLMClient abstract base class with generate/stream_generate interfaces
- Implement OpenAIClient with httpx for OpenAI-compatible API calls
- Add retry logic with tenacity for timeout handling
- Support both non-streaming and streaming generation
- Add comprehensive unit tests for LLM Adapter
- Fix entities.py JSON column type for SQLModel compatibility
2026-02-24 13:19:38 +08:00