llama: update to commit e1e8e099 (#10513)

2025-12-12 00:37:04 +00:00 · 2025-05-01 18:24:09 -07:00
parent e6d2d04121
commit 8dd12c873d
68 changed files with 3783 additions and 1774 deletions
--- a/llama/patches/0016-add-model-quantizations.patch
+++ b/llama/patches/0016-add-model-quantizations.patch
@@ -13,10 +13,10 @@ models not supported in llama.cpp
 4 files changed, 24 insertions(+)

 diff --git a/src/llama-arch.cpp b/src/llama-arch.cpp
-index 0568565f..dd01df60 100644
+index eb7b5325..df42d1a5 100644
 --- a/src/llama-arch.cpp
 +++ b/src/llama-arch.cpp
-@@ -73,6 +73,7 @@ static const std::map<llm_arch, const char *> LLM_ARCH_NAMES = {
+@@ -74,6 +74,7 @@ static const std::map<llm_arch, const char *> LLM_ARCH_NAMES = {
     { LLM_ARCH_WAVTOKENIZER_DEC, "wavtokenizer-dec" },
     { LLM_ARCH_PLM,              "plm"              },
     { LLM_ARCH_BAILINGMOE,       "bailingmoe"       },
@@ -24,7 +24,7 @@ index 0568565f..dd01df60 100644
     { LLM_ARCH_UNKNOWN,          "(unknown)"        },
 };
 
-@@ -1586,6 +1587,22 @@ static const std::map<llm_arch, std::map<llm_tensor, const char *>> LLM_TENSOR_N
+@@ -1606,6 +1607,22 @@ static const std::map<llm_arch, std::map<llm_tensor, const char *>> LLM_TENSOR_N
             { LLM_TENSOR_FFN_UP_SHEXP,       "blk.%d.ffn_up_shexp" },
         },
     },
@@ -48,10 +48,10 @@ index 0568565f..dd01df60 100644
         LLM_ARCH_UNKNOWN,
         {
 diff --git a/src/llama-arch.h b/src/llama-arch.h
-index 6a989034..b6227eeb 100644
+index bc8a4f0b..bda9d071 100644
 --- a/src/llama-arch.h
 +++ b/src/llama-arch.h
-@@ -75,6 +75,7 @@ enum llm_arch {
+@@ -76,6 +76,7 @@ enum llm_arch {
     LLM_ARCH_CHAMELEON,
     LLM_ARCH_SOLAR,
     LLM_ARCH_WAVTOKENIZER_DEC,
@@ -60,10 +60,10 @@ index 6a989034..b6227eeb 100644
     LLM_ARCH_BAILINGMOE,
     LLM_ARCH_UNKNOWN,
 diff --git a/src/llama-model.cpp b/src/llama-model.cpp
-index d051696c..c8374159 100644
+index 9d099f11..ef70486d 100644
 --- a/src/llama-model.cpp
 +++ b/src/llama-model.cpp
-@@ -1425,6 +1425,7 @@ void llama_model::load_hparams(llama_model_loader & ml) {
+@@ -1437,6 +1437,7 @@ void llama_model::load_hparams(llama_model_loader & ml) {
                     default: type = LLM_TYPE_UNKNOWN;
                 }
             } break;
@@ -71,7 +71,7 @@ index d051696c..c8374159 100644
         default: throw std::runtime_error("unsupported model architecture");
     }
 
-@@ -13704,6 +13705,7 @@ llama_rope_type llama_model_rope_type(const llama_model * model) {
+@@ -13751,6 +13752,7 @@ llama_rope_type llama_model_rope_type(const llama_model * model) {
         case LLM_ARCH_CHAMELEON:
         case LLM_ARCH_SOLAR:
         case LLM_ARCH_BAILINGMOE: