用openai库请求时，流式请求时缺stream_options={"include_usage": True}的处理，用于计算流式tokens #3998

sasicDHH · 2024-05-30T23:20:43Z

Reminder

I have read the README and searched the existing issues.

Reproduction

response = client.chat.completions.create(
        model=model_name,
        messages=[
            # {"role": "system", "content": "You are a helpful assistant."},
            {"role": "user", "content": msg_clean},
        ],
        temperature=0.8,
        top_p=0.8,
        max_tokens=2048,
        stream=True,
        stream_options={"include_usage": True},
    )

参考
建议在llamafactory/api/chat.py 第144行左右create_stream_chat_completion_response 函数下
_create_stream_chat_completion_chunk 对stream_options 处理

Expected behavior

计算steam=True时，通过stream_options={"include_usage": True}, 获取流式tokens
详细请参考

System Info

No response

Others

No response

The text was updated successfully, but these errors were encountered:

hiyouga added the pending This problem is yet to be addressed label Jun 3, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

用openai库请求时，流式请求时缺stream_options={"include_usage": True}的处理，用于计算流式tokens #3998

用openai库请求时，流式请求时缺stream_options={"include_usage": True}的处理，用于计算流式tokens #3998

sasicDHH commented May 30, 2024

用openai库 请求时，流式请求时缺stream_options={"include_usage": True}的处理，用于计算流式tokens #3998

用openai库 请求时，流式请求时缺stream_options={"include_usage": True}的处理，用于计算流式tokens #3998

Comments

sasicDHH commented May 30, 2024

Reminder

Reproduction

Expected behavior

System Info

Others

用openai库请求时，流式请求时缺stream_options={"include_usage": True}的处理，用于计算流式tokens #3998

用openai库请求时，流式请求时缺stream_options={"include_usage": True}的处理，用于计算流式tokens #3998