@@ -15,7 +15,7 @@ data:
|
|||||||
TGI_LLM_ENDPOINT: http://llm-dependency-svc.default.svc.cluster.local:9009
|
TGI_LLM_ENDPOINT: http://llm-dependency-svc.default.svc.cluster.local:9009
|
||||||
REDIS_URL: redis://vector-db.default.svc.cluster.local:6379
|
REDIS_URL: redis://vector-db.default.svc.cluster.local:6379
|
||||||
INDEX_NAME: rag-redis
|
INDEX_NAME: rag-redis
|
||||||
HUGGINGFACEHUB_API_TOKEN: {HF_TOKEN}
|
HUGGINGFACEHUB_API_TOKEN: ${HF_TOKEN}
|
||||||
EMBEDDING_SERVICE_HOST_IP: embedding-svc
|
EMBEDDING_SERVICE_HOST_IP: embedding-svc
|
||||||
RETRIEVER_SERVICE_HOST_IP: retriever-svc
|
RETRIEVER_SERVICE_HOST_IP: retriever-svc
|
||||||
RERANK_SERVICE_HOST_IP: reranking-svc
|
RERANK_SERVICE_HOST_IP: reranking-svc
|
||||||
|
|||||||
@@ -35,9 +35,9 @@ spec:
|
|||||||
- --model-id
|
- --model-id
|
||||||
- $(LLM_MODEL_ID)
|
- $(LLM_MODEL_ID)
|
||||||
- --max-input-length
|
- --max-input-length
|
||||||
- '2048'
|
- '1024'
|
||||||
- --max-total-tokens
|
- --max-total-tokens
|
||||||
- '4096'
|
- '2048'
|
||||||
- --max-batch-total-tokens
|
- --max-batch-total-tokens
|
||||||
- '65536'
|
- '65536'
|
||||||
- --max-batch-prefill-tokens
|
- --max-batch-prefill-tokens
|
||||||
|
|||||||
@@ -35,9 +35,9 @@ spec:
|
|||||||
- --model-id
|
- --model-id
|
||||||
- $(LLM_MODEL_ID)
|
- $(LLM_MODEL_ID)
|
||||||
- --max-input-length
|
- --max-input-length
|
||||||
- '2048'
|
- '1024'
|
||||||
- --max-total-tokens
|
- --max-total-tokens
|
||||||
- '4096'
|
- '2048'
|
||||||
- --max-batch-total-tokens
|
- --max-batch-total-tokens
|
||||||
- '65536'
|
- '65536'
|
||||||
- --max-batch-prefill-tokens
|
- --max-batch-prefill-tokens
|
||||||
|
|||||||
@@ -35,9 +35,9 @@ spec:
|
|||||||
- --model-id
|
- --model-id
|
||||||
- $(LLM_MODEL_ID)
|
- $(LLM_MODEL_ID)
|
||||||
- --max-input-length
|
- --max-input-length
|
||||||
- '2048'
|
- '1024'
|
||||||
- --max-total-tokens
|
- --max-total-tokens
|
||||||
- '4096'
|
- '2048'
|
||||||
- --max-batch-total-tokens
|
- --max-batch-total-tokens
|
||||||
- '65536'
|
- '65536'
|
||||||
- --max-batch-prefill-tokens
|
- --max-batch-prefill-tokens
|
||||||
|
|||||||
Reference in New Issue
Block a user