-
123
2025-12-23 21:24:41
人工智能
134°
20
ots.ocr 是一个强大的多语言文档解析器,它在一个单一的视觉-语言模型中统一了布局检测和内容识别,同时保持良好的阅读顺序。尽管其基础是紧凑的1.7B参数的大规模语言模型,但它达到了最先进的(SOTA)性能
-
Run
2025-08-28 15:43:17
人工智能
2303°
20
检索增强生成(RAG)是指对大语言模型输出进行优化
-
Run
2025-08-15 11:03:17
人工智能
2996°
20
智能浏览器自动化(Web-Agent)
-
Run
2025-08-12 16:13:32
人工智能
2504°
20
使用 LangChain 实现本地 Agent
-
Run
2025-08-12 12:35:35
人工智能
2448°
20
使用 LangChain 构建本地 RAG 应用
-
Run
2025-08-10 10:29:49
人工智能
3061°
20
如何使用大模型的函数调用(function calling)功能,这样就能让大模型调用成千上万的工具API,赋予大模型更多的外部知识,使得大模型能力变得更加强大。
-
Run
2025-08-12 10:03:36
人工智能
2449°
20
基于React的方式,制作了一个最小的Agent结构(其实更多的是调用工具)一步一步手写Agent,可以让我们对Agent的构成和运作更加的了解。
-
123
2025-07-07 21:34:54
人工智能
3264°
20
-
123
2025-06-27 18:41:35
人工智能
5381°
20
如何观测模型的微调过程?微调后的模型如何合并导出和部署?
-
123
2025-06-25 19:05:03
人工智能
5198°
20
微调模型的各种超参数怎么设置,每个超参数都是什么意思
-
123
2025-06-25 10:34:57
人工智能
3686°
20
如何给大模型构建高质量数据集?
-
123
2025-06-20 18:28:35
人工智能
5990°
20
MinerU是一款将PDF转化为机器可读格式的工具(如markdown、json),可以很方便地抽取为任意格式。
-
123
2025-06-20 11:24:02
人工智能
3973°
20
LLaMA Factory安装和基本使用详细
-
123
2025-05-17 21:14:24
人工智能
4027°
20
-
123
2025-04-29 21:45:20
requests
4963°
20
识别字体反爬特征,识别字体反爬特征,页面显示正常但源码为乱码,静态文件下载:从网页源码或CSS中提取字体URL,解析字体映射关系
-
123
2025-04-28 14:55:39
人工智能
3182°
20
-
123
2025-04-23 23:20:44
人工智能
2986°
20
基于Janus-Pro-7B的 ms-swift微调 ms-swift是魔搭社区提供的大模型与多模态大模型训练部署框架。现已支持450+大模型与150+多模态大模型的训练 (预训练、微调、人类对齐)
-
123
2025-04-23 19:20:27
selenium
2393°
20
Selenium 通过使用 WebDriver 支持市场上所有主流浏览器的自动化
-
123
2025-04-22 10:42:01
scrapy
2273°
20
在Scrapy框架中整合Pyppeteer(一个基于Chrome的无头浏览器,用于自动化网页渲染)可以让你执行更复杂的JavaScript渲染任务,这对于爬取依赖于JavaScript动态加载内容的网站非常有用
-
123
2025-04-18 21:45:18
人工智能
2609°
20
使用WSL(Linux子系统)做深度学习开发,Ubuntu会将系统默认安装在C盘,随着使用时间测增长,子系统的体积越来越大,本来就捉襟见肘的C盘更是雪上加霜,解决这个困扰。