手把手教你用Python调用AI Ping的API，免费把GLM-4.7或MiniMax M2.1集成到你的应用里

张

张建站

2026/4/26 8:30:20

10分钟阅读

手把手教你用Python调用AI Ping的API，免费把GLM-4.7或MiniMax M2.1集成到你的应用里

实战指南用Python快速集成GLM-4.7与MiniMax M2.1大模型API如果你正在寻找一种简单高效的方式将强大的AI能力集成到自己的应用中那么这篇教程正是为你准备的。我们将从零开始手把手教你如何通过Python调用AI Ping平台上的GLM-4.7和MiniMax M2.1大模型API无需复杂的配置就能让你的应用获得智能对话、代码生成等高级功能。1. 准备工作与环境配置在开始编写代码之前我们需要完成一些基础准备工作。首先确保你已经注册了AI Ping平台的账号。访问官网完成注册后登录到控制台页面你可以在API密钥部分找到专属的API Key这个密钥将用于后续的所有API调用。接下来我们需要设置Python开发环境。建议使用Python 3.8或更高版本并创建一个新的虚拟环境来管理项目依赖python -m venv aiping-env source aiping-env/bin/activate # Linux/Mac aiping-env\Scripts\activate # Windows安装必要的Python包我们将使用openai库来简化API调用pip install openai requests提示如果你计划在生产环境中使用这些API建议将依赖包及其版本记录在requirements.txt文件中以便于后续部署和维护。2. 基础API调用实现现在让我们实现最基本的API调用功能。我们将创建一个Python脚本能够向GLM-4.7或MiniMax M2.1模型发送请求并获取响应。首先导入必要的库并设置客户端from openai import OpenAI # 初始化客户端 client OpenAI( base_urlhttps://www.aiping.cn/api/v1, api_key你的API_KEY, # 替换为你的实际API密钥 )接下来我们可以定义一个简单的函数来发送消息并获取响应def get_chat_completion(model, messages): response client.chat.completions.create( modelmodel, messagesmessages, ) return response.choices[0].message.content # 示例使用 messages [ {role: user, content: 请用Python写一个快速排序算法} ] response get_chat_completion(GLM-4.7, messages) print(response)这个基础实现已经能够完成简单的问答交互。你可以通过修改messages列表中的内容来改变对话内容也可以切换model参数为MiniMax-M2.1来使用不同的模型。3. 高级功能与参数详解基础的API调用虽然简单但AI Ping平台提供了许多高级参数和功能可以帮助我们更好地控制模型行为优化性能和成本。3.1 流式响应处理对于长文本生成或需要实时显示结果的场景流式响应(streaming)可以显著提升用户体验。下面是如何实现流式响应的代码def stream_chat_completion(model, messages): response client.chat.completions.create( modelmodel, messagesmessages, streamTrue, ) for chunk in response: if chunk.choices[0].delta.content: print(chunk.choices[0].delta.content, end, flushTrue) # 使用示例 messages [ {role: user, content: 详细解释Python中的装饰器概念} ] stream_chat_completion(MiniMax-M2.1, messages)3.2 供应商选择与性能优化AI Ping平台允许你通过extra_body参数精细控制供应商选择策略。以下是一些常见的配置示例参数说明示例值provider.only只使用指定供应商[zhipu, qiniu]provider.order供应商优先级排序[qiniu, ppio]provider.sort自动排序依据latency (延迟) / throughput (吞吐量)input_price_range输入价格范围[0, 0.5] (元/千token)response client.chat.completions.create( modelGLM-4.7, messagesmessages, extra_body{ provider: { sort: latency, # 优先选择延迟最低的供应商 input_price_range: [0, 0.3], # 控制成本 } } )4. 错误处理与重试机制在实际应用中网络波动或API限制可能导致请求失败。一个健壮的实现需要包含适当的错误处理和重试机制。import time from openai import APIConnectionError, RateLimitError def robust_chat_completion(model, messages, max_retries3): retry_count 0 while retry_count max_retries: try: response client.chat.completions.create( modelmodel, messagesmessages, ) return response.choices[0].message.content except APIConnectionError as e: print(f连接错误: {e}, 重试中...) retry_count 1 time.sleep(2 ** retry_count) # 指数退避 except RateLimitError: print(达到速率限制, 等待后重试...) time.sleep(60) retry_count 1 except Exception as e: print(f未知错误: {e}) raise raise Exception(f请求失败达到最大重试次数 {max_retries}) # 使用示例 try: response robust_chat_completion(MiniMax-M2.1, messages) print(response) except Exception as e: print(f最终失败: {e})5. 构建完整应用示例现在我们将前面学到的知识整合起来构建一个简单的命令行聊天应用可以选择不同的模型进行对话。import os from openai import OpenAI class AIPingChat: def __init__(self): self.client OpenAI( base_urlhttps://www.aiping.cn/api/v1, api_keyos.getenv(AIPING_API_KEY), ) self.conversation_history [] def chat(self, model): print(f\n与 {model} 开始对话 (输入退出结束)) while True: user_input input(你: ) if user_input.lower() in [退出, exit]: break self.conversation_history.append({role: user, content: user_input}) try: response self.client.chat.completions.create( modelmodel, messagesself.conversation_history, streamTrue, ) print(f{model}: , end) full_response for chunk in response: if chunk.choices[0].delta.content: content chunk.choices[0].delta.content print(content, end, flushTrue) full_response content self.conversation_history.append({role: assistant, content: full_response}) print(\n) except Exception as e: print(f发生错误: {e}) self.conversation_history.pop() # 移除最后一条用户输入 if __name__ __main__: chat_app AIPingChat() while True: print(\n选择模型:) print(1. GLM-4.7) print(2. MiniMax M2.1) print(3. 退出) choice input(请输入选项: ) if choice 1: chat_app.chat(GLM-4.7) elif choice 2: chat_app.chat(MiniMax-M2.1) elif choice 3: break else: print(无效选项请重新输入)这个示例展示了如何构建一个交互式命令行聊天应用用户可以选择不同的模型进行对话并且对话历史会被保留以实现上下文感知。6. 性能优化与成本控制在实际应用中除了功能实现外我们还需要关注性能和成本优化。以下是一些实用技巧上下文长度管理定期清理对话历史避免发送过长的上下文响应时间预估对于流式响应可以先获取少量token来预估总响应时间成本监控记录每次调用的token使用量估算API调用成本def optimized_chat(model, messages, max_context_length4096): # 计算当前消息的总token数简化版 total_tokens sum(len(msg[content]) for msg in messages) # 如果上下文过长移除最早的对话记录 while total_tokens max_context_length and len(messages) 1: removed messages.pop(1) # 保留系统消息 total_tokens - len(removed[content]) response client.chat.completions.create( modelmodel, messagesmessages, streamTrue, ) # 获取第一个chunk的时间用于预估 start_time time.time() first_chunk next(response) first_chunk_time time.time() - start_time # 处理剩余响应 full_content first_chunk.choices[0].delta.content or for chunk in response: if chunk.choices[0].delta.content: full_content chunk.choices[0].delta.content # 计算性能指标 avg_speed len(full_content) / (time.time() - start_time) print(f平均生成速度: {avg_speed:.2f} 字符/秒) return full_content7. 实际应用场景扩展掌握了基础API调用后我们可以将这些能力应用到各种实际场景中。以下是几个典型应用示例7.1 自动化文档生成def generate_documentation(code, modelGLM-4.7): prompt f请为以下Python代码生成详细的文档说明包括函数用途、参数说明和返回值的描述 {code} response client.chat.completions.create( modelmodel, messages[{role: user, content: prompt}], ) return response.choices[0].message.content # 示例使用 python_code def calculate_stats(data): \\\计算数据的统计信息\\\ mean sum(data) / len(data) variance sum((x - mean) ** 2 for x in data) / len(data) return {mean: mean, variance: variance} print(generate_documentation(python_code))7.2 智能代码补全def code_completion(prompt, languagepython, modelMiniMax-M2.1): system_msg f你是一个专业的{language}程序员助手。根据用户提供的代码片段或描述完成代码实现。只返回代码部分不要包含任何解释或说明文字。 response client.chat.completions.create( modelmodel, messages[ {role: system, content: system_msg}, {role: user, content: prompt} ], temperature0.3, # 降低随机性提高确定性 ) return response.choices[0].message.content # 示例使用 prompt 实现一个Python函数计算斐波那契数列的第n项 print(code_completion(prompt))7.3 多语言翻译服务def translate_text(text, target_language, modelGLM-4.7): prompt f将以下文本翻译成{target_language}保持专业、准确的语气 {text} response client.chat.completions.create( modelmodel, messages[{role: user, content: prompt}], ) return response.choices[0].message.content # 示例使用 english_text The rapid advancement of AI technology is transforming various industries. print(translate_text(english_text, 中文))

微信聊天记录永久保存与智能分析：让数字记忆不再流失

微信聊天记录永久保存与智能分析：让数字记忆不再流失【免费下载链接】WeChatMsg 提取微信聊天记录，将其导出成HTML、Word、CSV文档永久保存，对聊天记录进行分析生成年度聊天报告项目地址: https://gitcode.com/GitHub_Trending/we/WeChat…...

2026/4/18 19:04:44 阅读更多 →

ESPEssentials：ESP8266/ESP32轻量级Arduino增强框架

1. 项目概述 ESPEssentials 是一个面向 ESP8266 和 ESP32 平台的轻量级 Arduino 框架增强库，其核心设计目标是消除嵌入式 Wi-Fi 应用开发中重复、繁琐且易出错的基础配置环节 ，让开发者聚焦于业务逻辑本身。它并非替代 Arduino Core 或 ESP-IDF 的底层…...

2026/4/20 12:48:35 阅读更多 →