LLMScraper:用大型语言模型(LLM)将任意网页转为结构化数据的Ty

爱生活爱珂珂 2025-07-20 11:40:10

LLM Scraper:用大型语言模型(LLM)将任意网页转为结构化数据的 TypeScript 库,助力数据抓取与自动化分析。

• 支持 GPT、Sonnet、Gemini、Llama、Qwen 等多款模型,兼容性强

• 采用 Zod 或 JSON Schema 定义结构,TypeScript 全类型安全保障

• 基于 Playwright 框架,支持 HTML、raw_html、markdown、text、image 五种格式输入

• 集成 Vercel AI SDK 4,支持流式对象输出与高效代码生成

• 多平台初始化示例覆盖 OpenAI、Anthropic、Google、Groq、Ollama 等主流 LLM 提供商

• 生成可复用 Playwright 脚本,轻松实现定制化爬取流程

• 开源项目,欢迎社区贡献,持续迭代优化

应用场景涵盖新闻摘要、产品信息抓取、网页内容结构化等,极大简化复杂网页数据处理流程。🔍

了解详情🔗 github.com/mishushakov/llm-scraper

大语言模型 网页爬取 结构化数据 TypeScript 自动化

0 阅读:0
爱生活爱珂珂

爱生活爱珂珂

感谢大家的关注