AI大模型今日: 0|主題: 314|排名: 18

怎么运营才不会亏本？本文讨论一个很多群友问的一个问题：我有一定的用户资源，想要部署一个来对外提供服务，请问我要把价格算力价格设置多少才合适呢？或者换句话说，我要怎么设置价格才不会亏本呢？我这里给大家提供一个简单的估算思路，供大家参考。不一定很准确，但是可以保证误差在可控范围内。 1. 算力成本首 ...

3236

大佬发表于 2026-5-16 讨论

大模型核心参数详解：从基础配置到高级调优指南

引言：参数调优的重要性在大语言模型的应用中，仅仅提供一个好的提示词往往不足以获得理想的输出结果。模型参数的合理配置同样至关重要，它如同给模型调配合适的“工作性格”，直接影响生成文本的质量、风格和适用场景。本文将系统介绍大模型的各类关键参数，帮助你从被动使用者转变为精准调控专家。一、模型基础结构参数 ...

184

不是数的澍发表于 2025-11-7 AI大模型

Visual Studio Copilot 全面升级：更智能的默认模型、多模型切换、更便捷的使用管理

作为全球最受欢迎的集成开发环境之一，Visual Studio 一直致力于为开发者提供高效、智能的开发体验。无论是构建现代 Web 应用、跨平台移动应用，还是进行企业级系统开发，Visual Studio 都凭借其强大的调试工具、智能代码提示、丰富插件生态和云端协作能力，成为众多开发者首选的生产力平台。近年来，随着 AI 助 ...

1134

张军长发表于 2025-7-25 AI大模型

读AI繁荣01AI之屋

1. AI是驱动第四次工业革命的通用技术 1.1. AI不仅被用作科学家的实验工具，而且开始广泛渗透到日常生活中，重塑着我们的工作、教育、社交、健康乃至情感体验 1.2. 着眼于构建公平、透明且负责任的AI系统，确保技术进步惠及每一个人，尤其是那些在传统社会结构中常被忽视的群体 1.3. AI不再是遥不可及 ...

140

金啸发表于 2025-8-13 AI大模型

Windows平台下CUDA安装及llama.cpp使用教程

本文将详细讲解Windows平台下，如何安装与NVIDIA RTX显卡匹配的CUDA工具包，并正确配置、使用llama.cpp加载大模型，实现模型高效运行（将模型几乎全放入显卡，提升推理速度），全程结合实操截图与具体命令，新手可直接跟着操作。 1.首先需要下载与RTX对应的CUDA驱动，此处必须保证完全一致，执行nvidia-smi命令获取版本信息 ...

261

他爹发表于 2026-4-29 AI大模型

大模型基础（四）：强化学习入门-从斯金纳箱到大模型推理

2025年图灵奖颁给了强化学习的奠基人Richard Sutton和Andrew Barto。为什么强化学习如此重要？它如何从训练老鼠变成训练大模型？这篇文章带你一探究竟。一、一个老鼠实验引发的革命 1.1 斯金纳箱：强化学习的源头 1930年代，心理学家斯金纳做了一个著名实验：实验过程：把一只老鼠放进箱子箱子里有一个杠杆老鼠偶 ...

3175

韬爷发表于 2026-5-4 AI大模型

Hy-MT1.5-1.8B-2bit：腾讯开源 574MB 能打败 72B 巨人的移动端翻译模型

Hy-MT1.5-1.8B-2bit：Tencent 开源 574MB 能打败 72B 巨人的移动端翻译模型 TL;DR Hy-MT1.5-1.8B-2bit 是腾讯混元团队推出的突破性 2-bit 量化翻译模型，将 3.3GB FP16 模型压缩至仅 574MB，同时保持世界级翻译质量基于腾讯自研的 SEQ（Stretched Elastic Quantization，弹性延伸量化）技术，属 AngelSlim 压缩工具包的 ...

2143

九杀发表于 2026-4-30 AI大模型

iNeuOS工业互联网操作系统集成大模型智库（iNeuOS_AiMind·心智灵慧）

1. 概述 iNeuOS工业互联网操作系统作为工业数字化底座，长期面向设备采集、数据处理、数据分析、报警监控、远程控制和业务应用集成等场景提供统一的平台能力。在工业现场，数据分散、经验分散、知识分散往往是企业推进智能化升级时遇到的第一道门槛。随着模型智库模块“iNeuOS_AiMind·心智 ...

1109

芮宁发表于 2026-5-5 AI大模型

彻底解决大模型 JSON 报错：提示词 + 硬约束 + 兜底的全链路修复方案

众所周知，大模型的核心原理是『文字接龙』，通过概率计算输出下一个 Token，这种机制天然存在幻觉问题，导致模型会一本正经的胡说八道。当要求大模型输出 JSON 格式时，也常因为幻觉问题遇到各种格式灾难：附带冗余话术：比如前后夹带“好的，这是你要的结果”、“以下是符合要求的JSON”。 Markdown 标签包裹：带有 ...

091

脾气不大发表于 2026-4-29 AI大模型

LangChain框架-基础

1.LangChain是什么？ LangChain 是⼀个⽤于开发---> 由（⼤型语⾔模型（LLMs）驱动的应⽤程序）的框架。简单来说理解就是一个用开发开发大模型应用的开发框架，内部集成了很多功能，也有很多第三方生态扩展，用起来事半功倍，就把他想象成C#中的.NET Core框架，go中的Gin。它简化了大语言模型应用程序生命周期的各个阶 ...

057

裸奔向前发表于 2026-4-24 AI大模型

方差在扩散模型保护中的作用

Variance in Adversarial Attack for Customized Diffusion Models IDProtector：一种对抗性噪声编码器，用于防范保留身份的图像生成 Related Works Tuning-based Customized Generation DreamBooth, Custom Diffusion, LoRA and Textual Inversion 需要多图像微调，它们需要大量的计算资源和时间 Encoder-based ID-Preserv ...

0104

荦确发表于 2026-4-21 AI大模型

Qwen3.6-35B-A3B 全面评测：阿里开源模型如何超越前沿级水平

Qwen3.6-35B-A3B 全面评测：阿里开源模型如何超越前沿级水平 TL;DR Qwen3.6-35B-A3B 是阿里 Qwen 团队2026年4月16日发布的最新开源模型，采用稀疏 MoE 架构，35B 总参数但每 token 仅激活 3B Apache 2.0 许可证，完全开源可商用在 Terminal-Bench 2.0 得分 51.5（vs Gemma4-31B 的 42.9），SWE-bench Verified 得分 73.4 ...

088

之一的之一发表于 2026-4-17 AI大模型

做 AI 应用必懂：Function Call 和 Skills，到底差在哪？

前言今天来详细讨论一下，function call 和 skills。function call 到底是什么，skills 到底是什么，它们分别解决什么问题，最本质的区别在哪，以及在 Agent 系统里该怎么配合 function call function call 的本质，是让模型以工程化的方式调用某个具体工具或函数以前模型想调用外部能力，通常只能口头表达——比如它输 ...

045

东北仙儿哥发表于 2026-4-14 AI大模型

先免费试用下Claude code安装使用（教程）

🧑‍💻 写在开头点赞 + 收藏 === 学会🤣🤣🤣 2026年了，如果还不会使用一款AI编程工具，未来将会越来越难行。今天我们先来使用一个终端编程比较火的工具：Claude code 一、安装 1、nodejs安装如果你本地没有node环境，是需要先安装node的，node版本至少要18.0以上，可点击下面地址跳转到nodejs官网下载下载Node.js ...

076

肖兴中发表于 2026-4-14 AI大模型

LlamaIndex高级RAG实战：从检索增强到知识图谱问答

一、RAG的局限与高级RAG 基础RAG（检索增强生成）存在明显短板：检索精度低、缺乏多跳推理、无法处理复杂查询。高级RAG通过查询改写、重排序、知识图谱增强等技术，将RAG从简单检索提升到深度问答。LlamaIndex是构建高级RAG系统的首选框架，提供丰富的索引结构和检索策略。二、LlamaIndex核心架构核心组件： - Document/N ...

077

南极磁场发表于 2026-4-14 AI大模型

AI应用-提示词工程

1.什么是提示词和提示词工程? 提示词和提示词工程提示词如何理解就是我们对大模型说的每一句话都是Prompt，例如咱们使用DeepSeek或者某包上面问一些问题，或者给出一些指令，而大模型跟你来回交互，其实就是在续写你给他的提示词（Prompt），当然也可以理解为用来引导模型输出特定的回答，或者做一些任务的一组词语。提示 ...

060

脆轻松发表于 2026-4-12 AI大模型

DeepSeek-V3 + Spring Boot实战：10分钟接入国产大模型API

一、DeepSeek-V3 简介 DeepSeek-V3是深度求索推出的最新大语言模型，在代码生成和中文理解上表现优异。其API兼容OpenAI格式，开发者可零成本迁移。本文将手把手演示Spring Boot接入DeepSeek-V3 API。二、获取API Key 1. 访问 platform.deepseek.com 注册账号 2. 进入API Keys页面，点击创建API Key 3. 复制Key（格式：sk-x ...

086

丁如意发表于 2026-4-12 AI大模型

别再混着用了：agent 和 workflow 到底有什么区别？

前言一个agent，一个workflow。很多朋友在群里一聊就是“我搞了个 agent”，结果仔细一看，其实只是配了个固定流程；也有老哥把本该交给 workflow 的事，硬塞给 agent，最后调了半天，成本起飞，效果还不稳定所以这篇文章，笔者就把 agent 和 workflow 的区别掰开揉碎了讲清楚基本概念 workflow 是什么说白了，它像流水 ...

060

渐进发表于 2026-4-10 AI大模型

LLM微调实战：用LoRA让大模型更懂你的业务

一、为什么需要微调？预训练大模型（如GPT、Llama、Qwen）具备强大的通用能力，但在垂直领域往往表现不佳。微调（Fine-tuning）通过在特定领域数据上继续训练，让模型"学会"你的业务知识、术语和风格。二、LoRA为什么是最佳选择？ LoRA（Low-Rank Adaptation）的核心思想是：冻结预训练模型的原始权重，只训练两个低秩矩 ...

035

话很少发表于 2026-4-8 AI大模型

Context 工程：如何把正确的上下文喂给 AI

我们在项目中一定都遇到过，AI 明明很"聪明"，工具也都接好了，结果你让它改个 bug，它改的完全不是你想要的文件；你让它写个组件，它生成了一套跟项目风格完全不搭的代码。这不是 AI 笨，也不是工具不行，「而是你"喂"给它的上下文不对。」你可以把 AI 想象成一个远程结对编程的同事——他水平很高，但「他只能看到你屏 ...

030

雪山之松发表于 2026-4-8 AI大模型

12 3 4 5 6 7 8 9 10 ... 16 / 16 頁下一頁

返回發新帖

AI大模型今日: 0|主題: 314|排名: 18

快速發帖

瀏覽過的版塊

AI大模型 今日: 0|主題: 314|排名: 18

快速發帖

瀏覽過的版塊

AI大模型今日: 0|主題: 314|排名: 18