作者文章

fwq

FWQ
AI教程
DeepSeek-R1聊天机器人开发教程
AI 领域的进步速度确实在以前所未有的速度前进。短短一周多的时间,DeepSeek-R1 LLM 模型的发布就以其令人印象深刻的准确性震撼了 AI 世界,其准确性与现有模型相当,但创建成本仅为典型成本的一小部分。 DeepSeek 团队成功地将其庞大的 671B 参数模型的推理能力提炼为基于 Qwen(DeepSeek-R1-Distill-Qwen-1.5B、7B、14B 和 32B)和 Llama(DeepSeek-R1-Distill-Llama-8B 和 70B)的 6 个小模型。这实际上意味着你可以使用自己的模型副本 – 自定义它、进行更改、在本地运行它或将其托管在云平台上。 在本博客中,我们用 Python 构建一个 DeepSeek-R1 聊天机器人。简而言之,Streamlit 用于前端,而在后端,通过对托管在 Snowflake 中的…
2025-02-16 阅读全文 →
FWQ
AI教程
9个AI开发必备JS开源库
我已经使用 Python 和 JavaScript 进行开发一段时间了,涉足 AI 和非 AI 项目。 虽然 Python 凭借其庞大的生态系统无可否认地主导着 AI 开发领域,但 JavaScript/TypeScript 拥有自己独特的优势,使其成为强有力的竞争者: 性能:由于其异步特性和非阻塞 I/O,JavaScript/TypeScript 在基于 Web 的应用程序中通常优于 Python。 集成:与 Web 技术的无缝兼容性使创建 AI 驱动的 Web…
2025-02-16 阅读全文 →
FWQ
AI教程
推理模型的训练:从原理到实践
推理模型并不完全是新事物,但 DeepSeek 的 R1 模型的发布在开源社区中引起了极大的兴奋。在阅读 DeepSeek-R1 论文后,我对他们的后训练技术特别感兴趣,据报道,该技术可以显着提高性能。 传统的后训练方法是监督微调 (SFT)。在 SFT 中,为模型提供提示和期望的输出,以了解用户偏好、结构对齐、安全协议等。本质上,SFT 展示了开发人员或用户对模型的期望,并引导它与这些示例保持一致。 既然已经提到了后训练,那么在深入研究 R1 的后训练方法之前,值得简要讨论一下预训练,因为两者是相关的。训练大型语言模型 (LLM) 的初始步骤之一是因果语言建模。在此阶段,模型通过关注前面的标记来学习预测序列中的下一个标记。此过程产生“基础”模型,这些模型以半监督的方式在大量公共文本数据上进行训练,没有明确的标签,以预测后续标记。说到公共文本数据,我们即将耗尽它(在某种程度上,在这种情况下忽略其他模式)。这种稀缺性是研究人员专注于 LLM 后训练阶段的主要驱动力之一。 回到后训练,存在许多技术,例如 SFT、PPO 和 DPO 等。虽然某些方法在特定领域表现更好,但它们通常会限制指令对齐的创作自由,或者在长时间运行中变得过于昂贵。相反,基础模型没有这些限制,但不可预测、难以指导,并且经常产生人类难以理解的输出。 R1 的作者发现了一种两全其美的方法:将原始模型与指令对齐,同时保留一定程度的创作自由。我不会在这里详细介绍整个过程,但从根本上讲,它们允许基础模型以相当大的自由度“推理”,同时设定专注于准确性和格式的简单目标。为了实现这一点,他们采用了强化学习,实施了一种称为“GRPO”(组相对策略优化)的优化技术。 GRPO 消除了对批评模型(传统上与策略模型大小相同并用于…
2025-02-16 阅读全文 →
FWQ
AI教程
DeepSeek-R1驱动的房地产AI代理
AI 代理对于自动化复杂的推理任务至关重要。Smolagents 是由 Hugging Face 开发的轻量级 AI 代理框架,允许将大型语言模型 (LLM) 与现实世界的数据处理无缝集成。与其他高级模型相比,DeepSeek-R1 是一种开源 LLM,它以更低的成本增强了推理能力。我们使用 Ollama 来托管 DeepSeek-R1,从而实现高效的本地部署。 本文探讨如何使用 Smolagents 和 DeepSeek-R1 构建推理代理,并利用工具进行网页抓取和数据导出。 1、Smolagents 概述 Smolagents 提供了一个极简的 AI 代理框架,专为开发人员设计,以便高效地构建和部署智能代理。 Smolagents的主要功能: 简单:紧凑的代码库(约…
2025-02-16 阅读全文 →
FWQ
AI教程
LangSmith简明教程
本文基于我的书和关于 LLM 的的内容。 为了创建这篇文章,我将使用上一篇文章中构建的代理:如何创建医疗代理/RAG 系统。 但别担心;文章和随附的笔记本都包含所有必要的代码。关于如何创建代理的解释不会像提到的文章中那样详细,因为在这种情况下,我将更多地关注 LangSmith 以及如何跟踪代理的内部流量。 与往常一样,本文将基于笔记本中的代码,可以在找到。 我的建议是在阅读文章时打开笔记本,并在完成后创建自己的版本。 1、加载数据集 首先,让我们加载数据集。正如我之前提到的,我将包含代码,但不提供详细解释: !pip install -q langchain==0.3.0 !pip install -q langchain-openai==0.2.0 !pip install -q langchainhub==0.1.21 !pip install -q datasets==3.0.0…
2025-02-16 阅读全文 →
FWQ
AI教程
DeepSeek-R1 671B本地运行指南
原始的 DeepSeek R1 是一个 6710 亿参数的语言模型,由 Unsloth AI 团队进行了动态量化,大小减少了 80%(从 720 GB 减少到 131 GB),同时保持了强大的性能。当添加模型卸载时,该模型可以在 24GB VRAM 下以低令牌/秒的推理速度运行。 为什么大小对大型语言模型很重要 大型语言模型本质上需要大量存储和计算资源。为所有参数保持全精度表示(通常为 FP16 或 FP32)变得不切实际,尤其是对于局部推理,因为它需要内存。量化(减少权重表示的位宽)通过大幅减少模型大小和内存占用提供了一种解决方案。然而,整个网络的简单、统一的量化可能会导致严重的性能下降,表现为不稳定的输出或重复的 token 生成。 动态量化:一种量身定制的方法 Unsloth AI…
2025-02-16 阅读全文 →
FWQ
AI教程
Zonos TTS 简明教程
文本转语音(TTS)技术已经取得了很大的进步,今天我很高兴向大家介绍 Zonos,这是一个令人印象深刻的开源 TTS 系统,提供高质量的语音合成和多语言支持。在本指南中,我们将探索如何使用 Google Colab 轻松上手 Zonos,使其对每个人来说都易于使用,无论他们的硬件配置如何。 1、什么是 Zonos? Zonos 是一个开源的文本转语音模型,可以克隆声音并在多种语言中生成自然的语音。它的特别之处在于能够在不同语言或表达不同情感时保持参考音频的声音特征。 Zonos关键特性包括: 支持多种语言(英语、日语、西班牙语等) 声音克隆功能 实时生成 ️ 可调语音参数 易于使用的界面 Zonos 可以用于各种用途: 内容创作:有声书、播客、视频旁白 教育:语言学习材料、教育内容 可访问性:为视觉障碍者提供文本转语音 娱乐:游戏角色声音、创意项目 Zonos 是开源且由社区驱动的。你可以: 在…
2025-02-16 阅读全文 →
FWQ
AI教程
DeepSeek GRPO强化学习算法
如果你在地球上,你现在一定听说过 DeepSeek 以及它是如何导致美国股市崩盘的。这个革命性模型的根源是“我的初恋”,即强化学习。因此,在这篇文章中,我们将尝试了解 GRPO,这是一种使这一切成为可能的强化学习算法。 1、预备知识 1.1 什么是强化学习中的策略? 在强化学习 (RL) 中,策略(policy)是代理用来决定在给定状态下采取哪种行动的策略。 确定性策略 (π(s)) → 始终为给定状态选择相同的动作。 随机策略 (π(a|s)) → 定义给定状态下动作的概率分布。 强化学习的目标是学习最大化累积奖励的最佳策略 (π*)。 1.2 什么是价值函数? 价值函数(value function)告诉我们一个状态或行动在未来奖励方面有多好。 状态值 (V) → 处于某种状态有多好。…
2025-02-16 阅读全文 →
FWQ
AI教程
12个数据可视化必备数据集
数据可视化不仅是一种强大的工具,可让数据科学家和分析师以易于理解的格式传达复杂的见解和发现,而且它也是希望进入该领域并展示新学到的技能的有抱负的数据科学家/分析师的第一步。 但还有另一件重要的事情需要考虑——数据集的选择。为数据可视化选择正确的数据集对于任何数据可视化项目的成功都至关重要——它可能意味着提供引人入胜的叙述或失败之间的区别。 但这就是我们来到 ODSC 的原因!让我们来看看各个领域的最佳数据可视化数据集列表,它们非常适合增强你的数据可视化项目并让你的数据故事栩栩如生,甚至只是帮助你丰富你的投资组合。 政府和开放数据源 1、美国政府开放数据 作为最全面的政府数据存储库之一,提供多个领域的数据集,包括农业、气候、教育和健康。该平台对于政策分析、经济可视化和公共部门项目特别有用,使用户能够探索美国政府格局中的趋势和见解。这些数据可视化数据集非常多样化,为新手和高级数据科学家提供了大量主题选择。 2、世界银行开放数据 对于那些对全球发展感兴趣的人,提供了有关健康、教育和经济指标等主题的大量数据集。它是可视化全球趋势和金融数据的首选来源,非常适合专注于国际发展、经济比较和贫困分析的项目。 社交媒体和网络数据 3、Google 趋势 提供了人们随时间搜索内容的见解,使其成为时间序列可视化、流行度分析和趋势预测的绝佳工具。通过利用这些数据,你可以创建可视化效果,捕捉公众对从政治到娱乐等各种主题的兴趣脉搏。 4、Twitter API / Twitter 数据 Twitter 庞大的实时和历史数据存储库是情绪分析、社交聆听和网络可视化的金矿。无论你是在研究最近事件的公众意见,还是分析围绕特定主题标签的参与度,都可以提供可视化所需的社交背景和深度。 科学和环境数据集 5、NASA 地球观测 (NEO) 对于环境和地理空间可视化,提供了卫星图像和各种地球相关变量的数据,例如温度、植被和云量。这些数据集对于专注于环境变化、气候分析和自然灾害可视化的项目来说是无价的。 6、NOAA 气候数据在线…
2025-02-16 阅读全文 →
FWQ
AI教程
3个最有效的表格提取SDK
本文深入探讨了从表格中提取数据的微妙世界,这项任务比提取纯文本要复杂得多。这种复杂性源于表格中经常出现的非常规结构,尤其是在研究论文中。与标准表格不同,这些表格可能没有清晰的界定,或者列标题和内容之间可能存在错位。这种半结构化表格对传统的提取方法提出了挑战,需要更高级的方法。 本文重点介绍旨在有效应对这些挑战的免费开源工具和技术。它探讨了处理非标准表格格式的各种策略,提供了有效提取数据的见解,即使是从格式最不规则的表格中也是如此。重点是提供实用、可访问的解决方案,这些解决方案可以处理表格数据提取的复杂性,而无需承担高昂的成本。通过这种探索,本文旨在让读者掌握在传统方法无法满足需求的世界中应对表格数据提取的知识。 在本文中,我们将研究用于表格数据提取的各种工具和技术,并将指导你完成有效实施这些解决方案所需的 Python 代码。 1、PDF 到图像转换(用于 OCR 工具) 我们探索一种基于 Python 的方法,用于将 PDF 文档转换为图像,这是使用 OCR(光学字符识别)工具的关键步骤。此过程涉及 PyMuPDF 库(称为 fitz)和 Python 图像库 (PIL)。提供的脚本将每个 PDF 页面转换为 PNG 图像,使其可供 OCR 软件读取。该方法保留 PDF…
2025-02-16 阅读全文 →