GGuGuDataingugudata.hashnode.dev·May 27 · 2 min read用高校数据、录取线和预测接口构建高考咨询 Agent摘要:高考咨询类产品不能只让模型凭常识回答。本文演示如何把高校基础信息、历年录取线、专业录取线和录取概率预测接口组合起来,构建一个更可解释的高考咨询 Agent。 关键词:高考志愿 Agent、高校录取概率预测 API、高校录取分数线 API、专业录取线 API、教育数据接口 问题背景 高考咨询的核心不是生成一段流畅建议,而是把考生省份、科类、分数、位次、目标地区、专业偏好和历史录取数据结合起来。00
GGuGuDataingugudata.hashnode.dev·May 27 · 2 min read用 OCR、PDF 转文本和摘要接口构建 RAG 文档入库 Agent摘要:RAG 系统的效果很大程度取决于文档入库质量。本文用图片 OCR、PDF 转文本和 PDF 摘要接口演示一个文档入库 Agent:先把文件内容变成可检索文本,再生成摘要和索引元数据。 关键词:RAG 文档入库、OCR API、PDF 转文本 API、PDF 摘要 API、知识库 Agent 问题背景 企业知识库里常见的资料并不都是纯文本,很多是扫描件、PDF 报告、合同截图或演示材料。如果直00
GGuGuDataingugudata.hashnode.dev·May 27 · 2 min read用 Agent 搭建网页内容采集与结构化处理流水线摘要:当采集目标不只是正文,而是标题、价格、作者、发布时间、链接和页面截图时,可以把网页处理拆成多个可验证步骤。本文用 URL 转 JSON、链接提取和网站截图接口演示一个更像工程系统的网页内容 Agent。 关键词:网页内容采集 Agent、URL 转 JSON API、链接提取 API、网站截图 API、结构化数据抽取 为什么需要流水线 很多网页采集需求一开始只是“帮我看一下这个页面”,最后会00
GGuGuDataingugudata.hashnode.dev·May 27 · 2 min read用 URL 转 Markdown 和摘要接口搭建 AI 研究助手摘要:这篇文章演示如何把一个网页研究任务拆成 Agent 可以执行的步骤:抓取网页、转成 Markdown、生成摘要、沉淀结构化笔记。它适合内容运营、产品调研、竞品资料整理和知识库入库等场景。 关键词:AI 研究助手、Agent 工作流、URL 转 Markdown API、文本摘要 API、网页内容处理 问题背景 很多研究任务的输入只是一个链接,但真实工作并不是“打开网页看看”这么简单。团队通常00
GGuGuDataingugudata.hashnode.dev·Jan 17 · 4 min readExtract Clean Article Content with Gugudata Article Extraction APIExtract Clean Article Content with Gugudata Article Extraction API In today’s digital world, extracting meaningful content from cluttered web pages is a critical challenge for developers, content aggregators, and data analysts. The Gugudata Article E...00