Ollama API测试脚本
这个脚本将测试以下内容:
1. ✅ 连接状态
2. 📋 模型信息
3. 💬 简单聊天
4. 🔄 流式聊天（检测thinking）
5. 🧪 多种prompt测试

🚀 开始Ollama API全面测试
============================================================
============================================================
1. 测试Ollama连接状态
============================================================
✅ 连接成功!
📊 可用模型: ['/root/Qwen3/Qwen3-0.6B-Q8_0.gguf']

============================================================
2. 测试模型信息
============================================================
❌ 模型信息获取失败: Client error '404 Not Found' for url 'http://localhost:11435/v1/api/show'
For more information check: https://developer.mozilla.org/en-US/docs/Web/HTTP/Status/404

============================================================
3. 测试简单聊天（非流式）
============================================================
📤 发送请求: 你好，请简单介绍一下你自己 /no_think
⏳ 等待响应...
✅ 响应成功 (耗时: 0.34s)
📥 完整响应: {
  "choices": [
    {
      "finish_reason": "stop",
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "<think>\n\n</think>\n\n您好！我是AI助手，旨在帮助您解决问题和获取信息。如果您有任何问题或需要帮助，请随时告诉我！"
      }
    }
  ],
  "created": 1757294766,
  "model": "qwen3:0.6b",
  "system_fingerprint": "b6407-3976dfbe",
  "object": "chat.completion",
  "usage": {
    "completion_tokens": 29,
    "prompt_tokens": 17,
    "total_tokens": 46
  },
  "id": "chatcmpl-3dTqMHZQSxrXfIYAPUvMA6lLerOLq6GK",
  "timings": {
    "cache_n": 16,
    "prompt_n": 1,
    "prompt_ms": 18.572,
    "prompt_per_token_ms": 18.572,
    "prompt_per_second": 53.84449709239716,
    "predicted_n": 29,
    "predicted_ms": 320.929,
    "predicted_per_token_ms": 11.066517241379309,
    "predicted_per_second": 90.36266588560088
  }
}
💬 回复内容: <think>

</think>

您好！我是AI助手，旨在帮助您解决问题和获取信息。如果您有任何问题或需要帮助，请随时告诉我！

============================================================
4. 测试流式聊天（检测thinking模式）
============================================================
📤 发送请求: 请思考一下这个问题：2+2等于多少？然后给出答案
🔄 开始流式响应...

📊 流式响应 chunks:
----------------------------------------

----------------------------------------
✅ 流式响应完成 (chunks: 400, 耗时: 4.63s)
💬 完整回复: 
🎯 未检测到THINKING模式

============================================================
5. 多种prompt测试thinking模式
============================================================

🔹 测试 1/4: 直接指令
   Prompt: 直接回答：2+2=?
   ✅ 结果: 无Thinking
   💬 回复: ...

🔹 测试 2/4: 思考指令
   Prompt: 请思考后回答：2+2=?
   ✅ 结果: 无Thinking
   💬 回复: ...

🔹 测试 3/4: 英文思考指令
   Prompt: Think step by step: 2+2=?
   ✅ 结果: 无Thinking
   💬 回复: ...

🔹 测试 4/4: 禁用思考指令
   Prompt: 无需思考，直接回答：2+2=?
   ✅ 结果: 无Thinking
   💬 回复: ...

============================================================
📊 测试报告摘要
============================================================
✅ 成功测试: 4/5
📈 成功率: 80.0%
📁 详细结果已保存到: ollama_test_results.json

⚠️  部分测试失败，请检查Ollama配置
