<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0">
  <channel>
    <title>云美公社 - AI大模型</title>
    <link>https://ym.gs/f-95-1</link>
    <description>Latest 20 threads of AI大模型</description>
    <copyright>Copyright(C) 云美公社</copyright>
    <generator>Discuz! Board by Discuz! Team</generator>
    <lastBuildDate>Wed, 03 Jun 2026 16:26:56 +0000</lastBuildDate>
    <ttl>60</ttl>
    <image>
      <url>https://ym.gs/static/image/common/logo_88_31.gif</url>
      <title>云美公社</title>
      <link>https://ym.gs/</link>
    </image>
    <item>
      <title>GeekAI-Plus怎么运营才不会亏本？</title>
      <link>https://ym.gs/t-68849-1-1.html</link>
      <description><![CDATA[怎么运营才不会亏本？

本文讨论一个很多群友问的一个问题：我有一定的用户资源，想要部署一个来对外提供服务，请问我要把价格算力价格设置多少才合适呢？ 或者换句话说，我要怎么设置价格才不会亏本呢？

我这里给大家提供一个简单的估算思路，供大家参考。不一定很准 ...]]></description>
      <category>AI大模型</category>
      <author>大佬</author>
      <pubDate>Fri, 15 May 2026 18:11:32 +0000</pubDate>
    </item>
    <item>
      <title>iNeuOS工业互联网操作系统集成大模型智库（iNeuOS_AiMind&#183;心智灵慧）</title>
      <link>https://ym.gs/t-47574-1-1.html</link>
      <description><![CDATA[1. 概述

&amp;nbsp; &amp;nbsp; iNeuOS工业互联网操作系统作为工业数字化底座，长期面向设备采集、数据处理、数据分析、报警监控、远程控制和业务应用集成等场景提供统一的平台能力。在工业现场，数据分散、经验分散、知识分散往往是企业推进智能化升级时遇到的第一道门槛。
&amp; ...]]></description>
      <category>AI大模型</category>
      <author>芮宁</author>
      <pubDate>Tue, 05 May 2026 04:08:00 +0000</pubDate>
    </item>
    <item>
      <title>大模型基础（四）：强化学习入门-从斯金纳箱到大模型推理</title>
      <link>https://ym.gs/t-47573-1-1.html</link>
      <description><![CDATA[2025年图灵奖颁给了强化学习的奠基人Richard Sutton和Andrew Barto。为什么强化学习如此重要？它如何从训练老鼠变成训练大模型？这篇文章带你一探究竟。


一、一个老鼠实验引发的革命
1.1 斯金纳箱：强化学习的源头
1930年代，心理学家斯金纳做了一个著名实验：
实验 ...]]></description>
      <category>AI大模型</category>
      <author>韬爷</author>
      <pubDate>Sun, 03 May 2026 23:30:00 +0000</pubDate>
    </item>
    <item>
      <title>Hy-MT1.5-1.8B-2bit：腾讯开源 574MB 能打败 72B 巨人的移动端翻译模型</title>
      <link>https://ym.gs/t-47572-1-1.html</link>
      <description><![CDATA[Hy-MT1.5-1.8B-2bit：Tencent 开源 574MB 能打败 72B 巨人的移动端翻译模型
 TL;DR

Hy-MT1.5-1.8B-2bit 是腾讯混元团队推出的突破性 2-bit 量化翻译模型，将 3.3GB FP16 模型压缩至仅 574MB，同时保持世界级翻译质量
基于腾讯自研的 SEQ（Stretched Elastic Quantizati ...]]></description>
      <category>AI大模型</category>
      <author>九杀</author>
      <pubDate>Thu, 30 Apr 2026 14:54:00 +0000</pubDate>
    </item>
    <item>
      <title>彻底解决大模型 JSON 报错：提示词 + 硬约束 + 兜底的全链路修复方案</title>
      <link>https://ym.gs/t-47571-1-1.html</link>
      <description><![CDATA[众所周知，大模型的核心原理是『文字接龙』，通过概率计算输出下一个 Token，这种机制天然存在幻觉问题，导致模型会一本正经的胡说八道。

当要求大模型输出 JSON 格式时，也常因为幻觉问题遇到各种格式灾难：

附带冗余话术：比如前后夹带“好的，这是你要的结果”、 ...]]></description>
      <category>AI大模型</category>
      <author>脾气不大</author>
      <pubDate>Wed, 29 Apr 2026 11:05:00 +0000</pubDate>
    </item>
    <item>
      <title>Windows平台下CUDA安装及llama.cpp使用教程</title>
      <link>https://ym.gs/t-47570-1-1.html</link>
      <description><![CDATA[本文将详细讲解Windows平台下，如何安装与NVIDIA RTX显卡匹配的CUDA工具包，并正确配置、使用llama.cpp加载大模型，实现模型高效运行（将模型几乎全放入显卡，提升推理速度），全程结合实操截图与具体命令，新手可直接跟着操作。
1.首先需要下载与RTX对应的CUDA驱动，此 ...]]></description>
      <category>AI大模型</category>
      <author>他爹</author>
      <pubDate>Wed, 29 Apr 2026 01:10:00 +0000</pubDate>
    </item>
    <item>
      <title>LangChain框架-基础</title>
      <link>https://ym.gs/t-47559-1-1.html</link>
      <description><![CDATA[1.LangChain是什么？
LangChain 是⼀个⽤于开发---&amp;gt; 由（⼤型语⾔模型（LLMs）驱动的应⽤程序）的框架。

简单来说理解就是一个用开发开发大模型应用的开发框架，内部集成了很多功能，也有很多第三方生态扩展，用起来事半功倍，就把他想象成C#中的.NET Core框架，go中的 ...]]></description>
      <category>AI大模型</category>
      <author>裸奔向前</author>
      <pubDate>Fri, 24 Apr 2026 15:05:00 +0000</pubDate>
    </item>
    <item>
      <title>方差在扩散模型保护中的作用</title>
      <link>https://ym.gs/t-47557-1-1.html</link>
      <description><![CDATA[Variance in Adversarial Attack for Customized Diffusion Models
IDProtector：一种对抗性噪声编码器，用于防范保留身份的图像生成
Related Works
Tuning-based Customized Generation
DreamBooth, Custom Diffusion, LoRA and Textual Inversion
需要多图像微调，它 ...]]></description>
      <category>AI大模型</category>
      <author>荦确</author>
      <pubDate>Tue, 21 Apr 2026 09:04:00 +0000</pubDate>
    </item>
    <item>
      <title>Qwen3.6-35B-A3B 全面评测：阿里开源模型如何超越前沿级水平</title>
      <link>https://ym.gs/t-47556-1-1.html</link>
      <description><![CDATA[Qwen3.6-35B-A3B 全面评测：阿里开源模型如何超越前沿级水平
TL;DR

Qwen3.6-35B-A3B 是阿里 Qwen 团队2026年4月16日发布的最新开源模型，采用稀疏 MoE 架构，35B 总参数但每 token 仅激活 3B
Apache 2.0 许可证，完全开源可商用
在 Terminal-Bench 2.0 得分 51.5（vs G ...]]></description>
      <category>AI大模型</category>
      <author>之一的之一</author>
      <pubDate>Fri, 17 Apr 2026 11:05:00 +0000</pubDate>
    </item>
    <item>
      <title>做 AI 应用必懂：Function Call 和 Skills，到底差在哪？</title>
      <link>https://ym.gs/t-47569-1-1.html</link>
      <description><![CDATA[前言
今天来详细讨论一下，function call 和 skills。function call 到底是什么，skills 到底是什么，它们分别解决什么问题，最本质的区别在哪，以及在 Agent 系统里该怎么配合
function call

function call 的本质，是让模型以工程化的方式调用某个具体工具或函数
以 ...]]></description>
      <category>AI大模型</category>
      <author>东北仙儿哥</author>
      <pubDate>Tue, 14 Apr 2026 07:10:00 +0000</pubDate>
    </item>
    <item>
      <title>先免费试用下Claude code安装使用（教程）</title>
      <link>https://ym.gs/t-47568-1-1.html</link>
      <description><![CDATA[🧑‍💻 写在开头
点赞 + 收藏 === 学会🤣🤣🤣

2026年了，如果还不会使用一款AI编程工具，未来将会越来越难行。 今天我们先来使用一个终端编程比较火的工具：Claude code




一、安装
1、nodejs安装

如果你本地没有node环境，是需要先安装node的，node版本至少要18.0 ...]]></description>
      <category>AI大模型</category>
      <author>肖兴中</author>
      <pubDate>Tue, 14 Apr 2026 06:38:00 +0000</pubDate>
    </item>
    <item>
      <title>LlamaIndex高级RAG实战：从检索增强到知识图谱问答</title>
      <link>https://ym.gs/t-47567-1-1.html</link>
      <description><![CDATA[一、RAG的局限与高级RAG
基础RAG（检索增强生成）存在明显短板：检索精度低、缺乏多跳推理、无法处理复杂查询。高级RAG通过查询改写、重排序、知识图谱增强等技术，将RAG从简单检索提升到深度问答。LlamaIndex是构建高级RAG系统的首选框架，提供丰富的索引结构和检索策 ...]]></description>
      <category>AI大模型</category>
      <author>南极磁场</author>
      <pubDate>Tue, 14 Apr 2026 01:02:00 +0000</pubDate>
    </item>
    <item>
      <title>AI应用-提示词工程</title>
      <link>https://ym.gs/t-47554-1-1.html</link>
      <description><![CDATA[1.什么是提示词和提示词工程?
提示词和提示词工程
提示词如何理解就是我们对大模型说的每一句话都是Prompt，例如咱们使用DeepSeek或者某包上面问一些问题，或者给出一些指令，而大模型跟你来回交互，其实就是在续写你给他的提示词（Prompt），当然也可以理解为用来引导 ...]]></description>
      <category>AI大模型</category>
      <author>脆轻松</author>
      <pubDate>Sun, 12 Apr 2026 06:41:00 +0000</pubDate>
    </item>
    <item>
      <title>DeepSeek-V3 + Spring Boot实战：10分钟接入国产大模型API</title>
      <link>https://ym.gs/t-47552-1-1.html</link>
      <description><![CDATA[一、DeepSeek-V3 简介
DeepSeek-V3是深度求索推出的最新大语言模型，在代码生成和中文理解上表现优异。其API兼容OpenAI格式，开发者可零成本迁移。本文将手把手演示Spring Boot接入DeepSeek-V3 API。
二、获取API Key
1. 访问 platform.deepseek.com 注册账号
2. 进入AP ...]]></description>
      <category>AI大模型</category>
      <author>丁如意</author>
      <pubDate>Sat, 11 Apr 2026 17:36:00 +0000</pubDate>
    </item>
    <item>
      <title>别再混着用了：agent 和 workflow 到底有什么区别？</title>
      <link>https://ym.gs/t-47550-1-1.html</link>
      <description><![CDATA[前言
一个agent，一个workflow。很多朋友在群里一聊就是“我搞了个 agent”，结果仔细一看，其实只是配了个固定流程；也有老哥把本该交给 workflow 的事，硬塞给 agent，最后调了半天，成本起飞，效果还不稳定
所以这篇文章，笔者就把 agent 和 workflow 的区别掰开揉碎 ...]]></description>
      <category>AI大模型</category>
      <author>渐进</author>
      <pubDate>Fri, 10 Apr 2026 05:54:00 +0000</pubDate>
    </item>
    <item>
      <title>LLM微调实战：用LoRA让大模型更懂你的业务</title>
      <link>https://ym.gs/t-47565-1-1.html</link>
      <description><![CDATA[一、为什么需要微调？
预训练大模型（如GPT、Llama、Qwen）具备强大的通用能力，但在垂直领域往往表现不佳。微调（Fine-tuning）通过在特定领域数据上继续训练，让模型\&quot;学会\&quot;你的业务知识、术语和风格。
二、LoRA为什么是最佳选择？
LoRA（Low-Rank Adaptation）的核心 ...]]></description>
      <category>AI大模型</category>
      <author>话很少</author>
      <pubDate>Wed, 08 Apr 2026 08:20:00 +0000</pubDate>
    </item>
    <item>
      <title>Context 工程：如何把正确的上下文喂给 AI</title>
      <link>https://ym.gs/t-47563-1-1.html</link>
      <description><![CDATA[我们在项目中一定都遇到过，AI 明明很\&quot;聪明\&quot;，工具也都接好了，结果你让它改个 bug，它改的完全不是你想要的文件；你让它写个组件，它生成了一套跟项目风格完全不搭的代码。
这不是 AI 笨，也不是工具不行，「而是你\&quot;喂\&quot;给它的上下文不对。」
你可以把 AI 想象成一个远 ...]]></description>
      <category>AI大模型</category>
      <author>雪山之松</author>
      <pubDate>Wed, 08 Apr 2026 04:14:00 +0000</pubDate>
    </item>
    <item>
      <title>OpenClaw AI助手本地部署完整教程</title>
      <link>https://ym.gs/t-47560-1-1.html</link>
      <description><![CDATA[换了套本地AI工具，叫OpenClaw。用了一段时间，稳定性不错，扩展性也比我预期的好用。顺手整理了份部署教程，给想尝鲜的朋友参考。
一、什么是OpenClaw
OpenClaw是一个本地的AI助手框架，核心能力是多Agent协作。
你可以把它理解成：一个Gateway（网关） + 多个专业Agen ...]]></description>
      <category>AI大模型</category>
      <author>养鸡场年久失俢</author>
      <pubDate>Mon, 06 Apr 2026 14:54:00 +0000</pubDate>
    </item>
    <item>
      <title>分布式智能体｜A2A Agent实战</title>
      <link>https://ym.gs/t-47548-1-1.html</link>
      <description><![CDATA[随着智能体应用的广泛应用，智能体的分布式部署、跨网络、跨框架、跨组织调用，成为当下智能体落地急需解决的问题。针对这一痛点，Google推出了Agent2Agent（简称A2A）协议，专为智能体之间的互联互通、协同协作提供标准化的解决方案。
本文基于Spring AI Alibaba框架， ...]]></description>
      <category>AI大模型</category>
      <author>秋潭之水</author>
      <pubDate>Thu, 02 Apr 2026 08:12:00 +0000</pubDate>
    </item>
    <item>
      <title>向量数据库实战：Milvus入门与Java集成</title>
      <link>https://ym.gs/t-47546-1-1.html</link>
      <description><![CDATA[前言
向量数据库是 RAG 系统的核心组件，负责存储和检索高维向量数据。Milvus 是最流行的开源向量数据库，支持十亿级向量检索。本文带你快速入门 Milvus，并完成 Java 集成。
一、Milvus 核心概念

Collection：向量数据的集合，类似数据库中的表
Partition：集合的分区 ...]]></description>
      <category>AI大模型</category>
      <author>永远的光辉</author>
      <pubDate>Thu, 02 Apr 2026 03:50:00 +0000</pubDate>
    </item>
  </channel>
</rss>