Linuxword Global
当前位置: AI人工智能 > 虚假新闻检测器 (Fake News Detector)

一个基于事实核查的虚假新闻自动检测系统,基于大型语言模型和BGE-M3-Embedding实现针对虚假新闻的事实核查,使用Streamlit构建Web界面。

screenshot

fake-news-detector/

├── app.py # 主应用程序入口
├── fact_checker.py # 事实核查核心逻辑
├── auth.py # 用户认证系统
├── db_utils.py # 数据库操作工具
├── pdf_export.py # PDF报告生成
├── requirements.txt # 项目依赖
├── api.py # API接口
├── gunicorn.conf.py # Gunicorn配置
├── start_server.sh #API启动脚本
├── .gitignore # Git忽略文件
├── LICENSE # 开源许可证
├── README.md # 项目说明文档

├── test/ # 测试目录
│ ├── api_test_page.html # api测试代码
└── docs/ # 文档目录
├── images/ # 文档中使用的图片
│ └── screenshot.png # 应用截图
├── api_doc.html # API文档
└── usage.md # 详细使用说明

 

项目特点

  • 🔍 自动提取核心声明:从新闻文本中提取可核查的核心声明
  • 🌐 实时网络搜索:利用DuckDuckGo搜索引擎获取相关证据
  • 🤖 语义匹配:使用BGE-M3大型嵌入模型计算声明与证据的相关性
  • 📊 分块证据处理:自动将长文本分段并找出最相关的证据片段
  • ✅ 可靠的事实核查:基于证据给出正确、错误或部分正确的判断
  • 🔄 流式处理界面:实时展示核查过程的每个步骤

快速开始

前提条件

  • Python 3.12
  • 本地部署的Qwen2.5模型或其他兼容OpenAI API的大语言模型
  • BGE-M3嵌入模型(可选择本地部署或远程API)

安装

  1. 克隆仓库
git clone https://github.com/yourusername/fake-news-detector.git
cd fake-news-detector
 
  1. 安装依赖
pip install -r requirements.txt
 
  1. 配置模型 在fact_checker.py中,根据需要修改BGE-M3模型路径:
self.embedding_model = BGEM3FlagModel('/path/to/your/bge-m3/')
 

启动应用

streamlit run app.py
 

应用将在本地启动,通常为 http://localhost:8501

使用方法

  1. 在应用界面中输入需要核查的新闻文本
  2. 系统会自动:
    • 提取新闻的核心声明
    • 搜索相关证据
    • 分析证据相关性
    • 给出事实核查结论

系统架构

该应用采用了多步骤管道流程进行事实核查:

  1. 提取阶段:使用LLM从输入文本中提取可核查的声明
  2. 搜索阶段:通过搜索引擎API获取相关证据
  3. 相关性排序:使用BGE-M3嵌入模型计算证据与声明的语义相似度
  4. 证据处理:将长文本分块并找出最相关的证据片段
  5. 判断阶段:基于相关证据做出判断并给出推理过程

技术栈

  • 前端界面: Streamlit
  • 语言模型: Qwen2.5-14B
  • 嵌入模型: BGE-M3
  • 搜索引擎: DuckDuckGo
  • 其他工具: NumPy, OpenAI兼容API

贡献指南

欢迎贡献代码、提交问题或改进建议。请遵循以下步骤:

  1. Fork该仓库
  2. 创建功能分支 (git checkout -b feature/xxx)
  3. 提交更改 (git commit -m 'Add xxx feature')
  4. 推送到分支 (git push origin feature/xxx)
  5. 创建Pull Request

「梦想一旦被付诸行动,就会变得神圣,如果觉得我的文章对您有用,请帮助本站成长」

赞(0) *** 在线联系博主***
+1(323)529-5889

TeleGram联系

WhatsAPP联系

上一篇:

下一篇:

相关推荐

博客简介

本站CDN采用VmShell免费提供离中国大陆最近的香港CMI高速网络做支撑,ToToTel打造全球最快速的边沿网络支撑服务,具体详情请见 :https://vmshell.com/ 以及 https://tototel.com/,网站所有的文件和内容禁止大陆网站搬迁复制,谢谢,VPS营销投稿邮箱: admin@linuxxword.com,我们免费帮大家发布,不收取任何费用,请提供完整测试文稿!

精彩评论

关于VmShell INC

VMSHELL INC 是一家成立于2021年的美国云计算服务公司,总部位于怀俄明州谢里丹,专注于提供全球数据中心的虚拟机服务器租赁和全球金融服务。 公司旗下品牌包括VmShell 和ToToTel,业务覆盖亚洲和美洲以及欧洲,致力于为外贸企业提供高效、稳定的网络解决方案。购买CMI香港服务器

站点统计

  • 文章总数: 3144 篇
  • 草稿数目: 0 篇
  • 分类数目: 9 个
  • 独立页面: 0 个
  • 评论总数: 2 条
  • 链接总数: 0 个
  • 标签总数: 48282 个
  • 注册用户: 139 人
  • 访问总量: 8,656,963 次
  • 最近更新: 2025年12月6日