Return Correct Prompt Eval Count Regardless of Cache Prompt (#5371)

* openai compatibility * Revert "openai compatibility" This reverts commit d3f98a811e00fc497d889c8c45b0cfec5b64690c. * remove erroneous subtraction of prompt cache
2025-12-10 15:57:04 +00:00 · 2024-07-03 13:46:23 -07:00
parent daed0634a9
commit 3b5a4a77f3
1 changed files with 1 additions and 1 deletions
--- a/llm/ext_server/server.cpp
+++ b/llm/ext_server/server.cpp
@@ -1732,7 +1732,7 @@ struct llama_server_context
                            slot.n_past -= 1;
                        }

-                        slot.n_prompt_tokens_processed = slot.n_prompt_tokens - slot.n_past;
+                        slot.n_prompt_tokens_processed = slot.n_prompt_tokens;

                        if (slot.ga_n != 1)
                        {