Add helm deployment instructions for codegen (#1351)

Signed-off-by: Dolpher Du <dolpher.du@intel.com>
2025-01-08 13:20:32 +08:00
parent 23117871c2
commit 5638075d65
15 changed files with 73 additions and 1482 deletions
--- a/CodeGen/README.md
+++ b/CodeGen/README.md
@@ -145,15 +145,9 @@ docker compose up -d
 Refer to the [Xeon Guide](./docker_compose/intel/cpu/xeon/README.md) for more instructions on building docker images from source.
 ### Deploy CodeGen using Kubernetes
 Refer to the [Kubernetes Guide](./kubernetes/intel/README.md) for instructions on deploying CodeGen into Kubernetes on Xeon & Gaudi.
 ### Deploy CodeGen into Kubernetes using Helm Chart
-Install Helm (version >= 3.15) first. Refer to the [Helm Installation Guide](https://helm.sh/docs/intro/install/) for more information.
+Refer to the [CodeGen helm chart](./kubernetes/helm/README.md) for instructions on deploying CodeGen into Kubernetes on Xeon & Gaudi.
 Refer to the [CodeGen helm chart](https://github.com/opea-project/GenAIInfra/tree/main/helm-charts/codegen/README.md) for instructions on deploying CodeGen into Kubernetes on Xeon & Gaudi.
 ## Consume CodeGen Service
--- a/CodeGen/kubernetes/intel/README_gmc.md
+++ b/CodeGen/kubernetes/intel/README_gmc.md
--- a/CodeGen/kubernetes/intel/hpu/gaudi/gmc/codegen_gaudi.yaml
+++ b/CodeGen/kubernetes/intel/hpu/gaudi/gmc/codegen_gaudi.yaml
--- a/CodeGen/kubernetes/intel/cpu/xeon/gmc/codegen_xeon.yaml
+++ b/CodeGen/kubernetes/intel/cpu/xeon/gmc/codegen_xeon.yaml
--- a/CodeGen/kubernetes/helm/README.md
+++ b/CodeGen/kubernetes/helm/README.md
@@ -0,0 +1,18 @@
 # Deploy CodeGen on kubernetes cluster
 - You should have Helm (version >= 3.15) installed. Refer to the [Helm Installation Guide](https://helm.sh/docs/intro/install/) for more information.
 - For more deploy options, refer to [helm charts README](https://github.com/opea-project/GenAIInfra/tree/main/helm-charts#readme).
 ## Deploy on Xeon
 ```
 export HFTOKEN="insert-your-huggingface-token-here"
 helm install codegen oci://ghcr.io/opea-project/charts/codegen  --set global.HUGGINGFACEHUB_API_TOKEN=${HFTOKEN} -f cpu-values.yaml
 ```
 ## Deploy on Gaudi
 ```
 export HFTOKEN="insert-your-huggingface-token-here"
 helm install codegen oci://ghcr.io/opea-project/charts/codegen  --set global.HUGGINGFACEHUB_API_TOKEN=${HFTOKEN} -f gaudi-values.yaml
 ```
--- a/CodeGen/kubernetes/helm/cpu-values.yaml
+++ b/CodeGen/kubernetes/helm/cpu-values.yaml
@@ -0,0 +1,9 @@
 # Copyright (C) 2024 Intel Corporation
 # SPDX-License-Identifier: Apache-2.0
 image:
  repository: opea/codegen
  tag: "latest"
 tgi:
  LLM_MODEL_ID: Qwen/Qwen2.5-Coder-7B-Instruct
--- a/CodeGen/kubernetes/helm/gaudi-values.yaml
+++ b/CodeGen/kubernetes/helm/gaudi-values.yaml
@@ -0,0 +1,28 @@
 # Copyright (C) 2024 Intel Corporation
 # SPDX-License-Identifier: Apache-2.0
 tgi:
  accelDevice: "gaudi"
  LLM_MODEL_ID: Qwen/Qwen2.5-Coder-7B-Instruct
  image:
    repository: ghcr.io/huggingface/tgi-gaudi
    tag: "2.0.6"
  resources:
    limits:
      habana.ai/gaudi: 1
  MAX_INPUT_LENGTH: "1024"
  MAX_TOTAL_TOKENS: "2048"
  CUDA_GRAPHS: ""
  livenessProbe:
    initialDelaySeconds: 5
    periodSeconds: 5
    timeoutSeconds: 1
  readinessProbe:
    initialDelaySeconds: 5
    periodSeconds: 5
    timeoutSeconds: 1
  startupProbe:
    initialDelaySeconds: 5
    periodSeconds: 5
    timeoutSeconds: 1
    failureThreshold: 120
--- a/CodeGen/kubernetes/intel/README.md
+++ b/CodeGen/kubernetes/intel/README.md
@@ -1,48 +0,0 @@
 # Deploy CodeGen in Kubernetes Cluster
 > [NOTE]
 > The following values must be set before you can deploy:
 > HUGGINGFACEHUB_API_TOKEN
 >
 > You can also customize the "MODEL_ID" if needed.
 >
 > You need to make sure you have created the directory `/mnt/opea-models` to save the cached model on the node where the CodeGen workload is running. Otherwise, you need to modify the `codegen.yaml` file to change the `model-volume` to a directory that exists on the node.
 > Alternatively, you can change the `codegen.yaml` to use a different type of volume, such as a persistent volume claim.
 ## Deploy On Xeon
 ```
 cd GenAIExamples/CodeGen/kubernetes/intel/cpu/xeon/manifest
 export HUGGINGFACEHUB_API_TOKEN="YourOwnToken"
 export MODEL_ID="Qwen/Qwen2.5-Coder-7B-Instruct"
 sed -i "s/insert-your-huggingface-token-here/${HUGGINGFACEHUB_API_TOKEN}/g" codegen.yaml
 sed -i "s/meta-llama\/CodeLlama-7b-hf/${MODEL_ID}/g" codegen.yaml
 kubectl apply -f codegen.yaml
 ```
 ## Deploy On Gaudi
 ```
 cd GenAIExamples/CodeGen/kubernetes/intel/hpu/gaudi/manifest
 export HUGGINGFACEHUB_API_TOKEN="YourOwnToken"
 sed -i "s/insert-your-huggingface-token-here/${HUGGINGFACEHUB_API_TOKEN}/g" codegen.yaml
 kubectl apply -f codegen.yaml
 ```
 ## Verify Services
 To verify the installation, run the command `kubectl get pod` to make sure all pods are running.
 Then run the command `kubectl port-forward svc/codegen 7778:7778` to expose the CodeGen service for access.
 Open another terminal and run the following command to verify the service if working:
 > Note that it may take a couple of minutes for the service to be ready. If the `curl` command below fails, you
 > can check the logs of the codegen-tgi pod to see its status or check for errors.
 ```
 kubectl get pods
 curl http://localhost:7778/v1/codegen -H "Content-Type: application/json" -d '{
     "messages": "Implement a high-level API for a TODO list application. The API takes as input an operation request and updates the TODO list in place. If the request is invalid, raise an exception."
     }'
 ```
--- a/CodeGen/kubernetes/intel/cpu/xeon/manifest/README_react_ui.md
+++ b/CodeGen/kubernetes/intel/cpu/xeon/manifest/README_react_ui.md
@@ -1,38 +0,0 @@
 # Deploy CodeGen with ReactUI
 The README provides a step-by-step guide on how to deploy CodeGen with ReactUI, a popular React-based user interface library in Kubernetes cluster.
 You can use react-codegen.yaml to deploy CodeGen with reactUI.
 ```
 kubectl apply -f react-codegen.yaml
 ```
 ## Prerequisites for Deploying CodeGen with ReactUI
 Before deploying the react-codegen.yaml file, ensure that you have the following prerequisites in place:
 1. Kubernetes installation: Make sure that you have Kubernetes installed.
 2. Configuration Values: Set the following values in react-codegen.yaml before proceeding with the deployment:
    a. HUGGINGFACEHUB_API_TOKEN (Your HuggingFace token to download your desired model from HuggingFace):
    ```
    # You may set the HUGGINGFACEHUB_API_TOKEN via method:
    export HUGGINGFACEHUB_API_TOKEN="YourOwnToken"
    cd GenAIExamples/CodeGen/kubernetes/intel/cpu/xeon/manifest/ui/
    sed -i "s/insert-your-huggingface-token-here/${HUGGINGFACEHUB_API_TOKEN}/g" react-codegen.yaml
    ```
    b. Set the proxies based on your network configuration
    ```
    # Look for http_proxy, https_proxy, no_proxy key and fill up the value with your proxy configuration.
    ```
 3. MODEL_ID and model-volume (OPTIONAL): You may as well customize the "MODEL_ID" to use different model and model-volume for the volume to be mounted.
 4. After completing these, you can proceed with the deployment of the react-codegen.yaml file.
 ## Verify Services
 Make sure all the pods are running, you should see total of 4 pods running:
 - codegen
 - codegen-llm-uservice
 - codegen-react-ui
 - codegen-tgi
 You may open up the UI by using the codegen-react-ui endpoint in the browser.
--- a/CodeGen/kubernetes/intel/cpu/xeon/manifest/codegen.yaml
+++ b/CodeGen/kubernetes/intel/cpu/xeon/manifest/codegen.yaml
@@ -1,543 +0,0 @@
 ---
 # Source: codegen/charts/codegen-ui/templates/configmap.yaml
 # Copyright (C) 2024 Intel Corporation
 # SPDX-License-Identifier: Apache-2.0
 apiVersion: v1
 kind: ConfigMap
 metadata:
  name: codegen-codegen-ui-config
  labels:
    helm.sh/chart: codegen-ui-1.0.0
    app.kubernetes.io/name: codegen-ui
    app.kubernetes.io/instance: codegen
    app.kubernetes.io/version: "v1.0"
    app.kubernetes.io/managed-by: Helm
 data:
  APP_BACKEND_SERVICE_ENDPOINT: "/v1/codegen"
  APP_DATA_PREP_SERVICE_URL: "/v1/dataprep"
  CHAT_BASE_URL: "/v1/codegen"
  UPLOAD_FILE_BASE_URL: "/v1/dataprep"
  GET_FILE: "/v1/dataprep/get_file"
  DELETE_FILE: "/v1/dataprep/delete_file"
  BASE_URL: "/v1/codegen"
  DOC_BASE_URL: "/v1/codegen"
  BASIC_URL: "/v1/codegen"
  VITE_CODE_GEN_URL: "/v1/codegen"
  VITE_DOC_SUM_URL: "/v1/codegen"
 ---
 # Source: codegen/charts/llm-uservice/templates/configmap.yaml
 # Copyright (C) 2024 Intel Corporation
 # SPDX-License-Identifier: Apache-2.0
 apiVersion: v1
 kind: ConfigMap
 metadata:
  name: codegen-llm-uservice-config
  labels:
    helm.sh/chart: llm-uservice-1.0.0
    app.kubernetes.io/name: llm-uservice
    app.kubernetes.io/instance: codegen
    app.kubernetes.io/version: "v1.0"
    app.kubernetes.io/managed-by: Helm
 data:
  TGI_LLM_ENDPOINT: "http://codegen-tgi"
  HUGGINGFACEHUB_API_TOKEN: "insert-your-huggingface-token-here"
  HF_HOME: "/tmp/.cache/huggingface"
  http_proxy: ""
  https_proxy: ""
  no_proxy: ""
  LOGFLAG: ""
 ---
 # Source: codegen/charts/tgi/templates/configmap.yaml
 # Copyright (C) 2024 Intel Corporation
 # SPDX-License-Identifier: Apache-2.0
 apiVersion: v1
 kind: ConfigMap
 metadata:
  name: codegen-tgi-config
  labels:
    helm.sh/chart: tgi-1.0.0
    app.kubernetes.io/name: tgi
    app.kubernetes.io/instance: codegen
    app.kubernetes.io/version: "2.1.0"
    app.kubernetes.io/managed-by: Helm
 data:
  MODEL_ID: "Qwen/Qwen2.5-Coder-7B-Instruct"
  PORT: "2080"
  HF_TOKEN: "insert-your-huggingface-token-here"
  http_proxy: ""
  https_proxy: ""
  no_proxy: ""
  HABANA_LOGS: "/tmp/habana_logs"
  NUMBA_CACHE_DIR: "/tmp"
  HF_HOME: "/tmp/.cache/huggingface"
  CUDA_GRAPHS: "0"
 ---
 # Source: codegen/templates/nginx-deployment.yaml
 apiVersion: v1
 data:
  default.conf: |+
    # Copyright (C) 2024 Intel Corporation
    # SPDX-License-Identifier: Apache-2.0
    server {
        listen       80;
        listen  [::]:80;
        location /home {
            alias  /usr/share/nginx/html/index.html;
        }
        location / {
            proxy_pass http://codegen-codegen-ui:5174;
            proxy_set_header Host $host;
            proxy_set_header X-Real-IP $remote_addr;
            proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
            proxy_set_header X-Forwarded-Proto $scheme;
        }
        location /v1/codegen {
            proxy_pass http://codegen:7778;
            proxy_set_header Host $host;
            proxy_set_header X-Real-IP $remote_addr;
            proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
            proxy_set_header X-Forwarded-Proto $scheme;
        }
    }
 kind: ConfigMap
 metadata:
  name: codegen-nginx-config
 ---
 # Source: codegen/charts/codegen-ui/templates/service.yaml
 # Copyright (C) 2024 Intel Corporation
 # SPDX-License-Identifier: Apache-2.0
 apiVersion: v1
 kind: Service
 metadata:
  name: codegen-codegen-ui
  labels:
    helm.sh/chart: codegen-ui-1.0.0
    app.kubernetes.io/name: codegen-ui
    app.kubernetes.io/instance: codegen
    app.kubernetes.io/version: "v1.0"
    app.kubernetes.io/managed-by: Helm
 spec:
  type: ClusterIP
  ports:
    - port: 5174
      targetPort: ui
      protocol: TCP
      name: ui
  selector:
    app.kubernetes.io/name: codegen-ui
    app.kubernetes.io/instance: codegen
 ---
 # Source: codegen/charts/llm-uservice/templates/service.yaml
 # Copyright (C) 2024 Intel Corporation
 # SPDX-License-Identifier: Apache-2.0
 apiVersion: v1
 kind: Service
 metadata:
  name: codegen-llm-uservice
  labels:
    helm.sh/chart: llm-uservice-1.0.0
    app.kubernetes.io/name: llm-uservice
    app.kubernetes.io/instance: codegen
    app.kubernetes.io/version: "v1.0"
    app.kubernetes.io/managed-by: Helm
 spec:
  type: ClusterIP
  ports:
    - port: 9000
      targetPort: 9000
      protocol: TCP
      name: llm-uservice
  selector:
    app.kubernetes.io/name: llm-uservice
    app.kubernetes.io/instance: codegen
 ---
 # Source: codegen/charts/tgi/templates/service.yaml
 # Copyright (C) 2024 Intel Corporation
 # SPDX-License-Identifier: Apache-2.0
 apiVersion: v1
 kind: Service
 metadata:
  name: codegen-tgi
  labels:
    helm.sh/chart: tgi-1.0.0
    app.kubernetes.io/name: tgi
    app.kubernetes.io/instance: codegen
    app.kubernetes.io/version: "2.1.0"
    app.kubernetes.io/managed-by: Helm
 spec:
  type: ClusterIP
  ports:
    - port: 80
      targetPort: 2080
      protocol: TCP
      name: tgi
  selector:
    app.kubernetes.io/name: tgi
    app.kubernetes.io/instance: codegen
 ---
 # Source: codegen/templates/nginx-deployment.yaml
 apiVersion: v1
 kind: Service
 metadata:
  name: codegen-nginx
 spec:
  ports:
  - port: 80
    protocol: TCP
    targetPort: 80
  selector:
    app.kubernetes.io/name: codegen
    app.kubernetes.io/instance: codegen
    app: codegen-nginx
  type: NodePort
 ---
 # Source: codegen/templates/service.yaml
 # Copyright (C) 2024 Intel Corporation
 # SPDX-License-Identifier: Apache-2.0
 apiVersion: v1
 kind: Service
 metadata:
  name: codegen
  labels:
    helm.sh/chart: codegen-1.0.0
    app.kubernetes.io/name: codegen
    app.kubernetes.io/instance: codegen
    app.kubernetes.io/version: "v1.0"
    app.kubernetes.io/managed-by: Helm
 spec:
  type: ClusterIP
  ports:
    - port: 7778
      targetPort: 7778
      protocol: TCP
      name: codegen
  selector:
    app.kubernetes.io/name: codegen
    app.kubernetes.io/instance: codegen
    app: codegen
 ---
 # Source: codegen/charts/codegen-ui/templates/deployment.yaml
 # Copyright (C) 2024 Intel Corporation
 # SPDX-License-Identifier: Apache-2.0
 apiVersion: apps/v1
 kind: Deployment
 metadata:
  name: codegen-codegen-ui
  labels:
    helm.sh/chart: codegen-ui-1.0.0
    app.kubernetes.io/name: codegen-ui
    app.kubernetes.io/instance: codegen
    app.kubernetes.io/version: "v1.0"
    app.kubernetes.io/managed-by: Helm
 spec:
  replicas: 1
  selector:
    matchLabels:
      app.kubernetes.io/name: codegen-ui
      app.kubernetes.io/instance: codegen
  template:
    metadata:
      labels:
        helm.sh/chart: codegen-ui-1.0.0
        app.kubernetes.io/name: codegen-ui
        app.kubernetes.io/instance: codegen
        app.kubernetes.io/version: "v1.0"
        app.kubernetes.io/managed-by: Helm
    spec:
      securityContext:
        {}
      containers:
        - name: codegen-ui
          envFrom:
            - configMapRef:
                name: codegen-codegen-ui-config
          securityContext:
            {}
          image: "opea/codegen-ui:latest"
          imagePullPolicy: IfNotPresent
          ports:
            - name: ui
              containerPort: 5173
              protocol: TCP
          resources:
            {}
          volumeMounts:
            - mountPath: /tmp
              name: tmp
      volumes:
        - name: tmp
          emptyDir: {}
 ---
 # Source: codegen/charts/llm-uservice/templates/deployment.yaml
 # Copyright (C) 2024 Intel Corporation
 # SPDX-License-Identifier: Apache-2.0
 apiVersion: apps/v1
 kind: Deployment
 metadata:
  name: codegen-llm-uservice
  labels:
    helm.sh/chart: llm-uservice-1.0.0
    app.kubernetes.io/name: llm-uservice
    app.kubernetes.io/instance: codegen
    app.kubernetes.io/version: "v1.0"
    app.kubernetes.io/managed-by: Helm
 spec:
  replicas: 1
  selector:
    matchLabels:
      app.kubernetes.io/name: llm-uservice
      app.kubernetes.io/instance: codegen
  template:
    metadata:
      labels:
        app.kubernetes.io/name: llm-uservice
        app.kubernetes.io/instance: codegen
    spec:
      securityContext:
        {}
      containers:
        - name: codegen
          envFrom:
            - configMapRef:
                name: codegen-llm-uservice-config
          securityContext:
            allowPrivilegeEscalation: false
            capabilities:
              drop:
              - ALL
            readOnlyRootFilesystem: false
            runAsNonRoot: true
            runAsUser: 1000
            seccompProfile:
              type: RuntimeDefault
          image: "opea/llm-textgen:latest"
          imagePullPolicy: IfNotPresent
          ports:
            - name: llm-uservice
              containerPort: 9000
              protocol: TCP
          volumeMounts:
            - mountPath: /tmp
              name: tmp
          livenessProbe:
            failureThreshold: 24
            httpGet:
              path: v1/health_check
              port: llm-uservice
            initialDelaySeconds: 5
            periodSeconds: 5
          readinessProbe:
            httpGet:
              path: v1/health_check
              port: llm-uservice
            initialDelaySeconds: 5
            periodSeconds: 5
          startupProbe:
            failureThreshold: 120
            httpGet:
              path: v1/health_check
              port: llm-uservice
            initialDelaySeconds: 5
            periodSeconds: 5
          resources:
            {}
      volumes:
        - name: tmp
          emptyDir: {}
 ---
 # Source: codegen/charts/tgi/templates/deployment.yaml
 # Copyright (C) 2024 Intel Corporation
 # SPDX-License-Identifier: Apache-2.0
 apiVersion: apps/v1
 kind: Deployment
 metadata:
  name: codegen-tgi
  labels:
    helm.sh/chart: tgi-1.0.0
    app.kubernetes.io/name: tgi
    app.kubernetes.io/instance: codegen
    app.kubernetes.io/version: "2.1.0"
    app.kubernetes.io/managed-by: Helm
 spec:
  # use explicit replica counts only of HorizontalPodAutoscaler is disabled
  replicas: 1
  selector:
    matchLabels:
      app.kubernetes.io/name: tgi
      app.kubernetes.io/instance: codegen
  template:
    metadata:
      labels:
        app.kubernetes.io/name: tgi
        app.kubernetes.io/instance: codegen
    spec:
      securityContext:
        {}
      containers:
        - name: tgi
          envFrom:
            - configMapRef:
                name: codegen-tgi-config
          securityContext:
            allowPrivilegeEscalation: false
            capabilities:
              drop:
              - ALL
            readOnlyRootFilesystem: true
            runAsNonRoot: true
            runAsUser: 1000
            seccompProfile:
              type: RuntimeDefault
          image: "ghcr.io/huggingface/text-generation-inference:2.4.0-intel-cpu"
          imagePullPolicy: IfNotPresent
          volumeMounts:
            - mountPath: /data
              name: model-volume
            - mountPath: /tmp
              name: tmp
          ports:
            - name: http
              containerPort: 2080
              protocol: TCP
          livenessProbe:
            failureThreshold: 24
            initialDelaySeconds: 5
            periodSeconds: 5
            tcpSocket:
              port: http
          readinessProbe:
            initialDelaySeconds: 5
            periodSeconds: 5
            tcpSocket:
              port: http
          startupProbe:
            failureThreshold: 120
            initialDelaySeconds: 5
            periodSeconds: 5
            tcpSocket:
              port: http
          resources:
            {}
      volumes:
        - name: model-volume
          emptyDir: {}
        - name: tmp
          emptyDir: {}
 ---
 # Source: codegen/templates/deployment.yaml
 # Copyright (C) 2024 Intel Corporation
 # SPDX-License-Identifier: Apache-2.0
 apiVersion: apps/v1
 kind: Deployment
 metadata:
  name: codegen
  labels:
    helm.sh/chart: codegen-1.0.0
    app.kubernetes.io/name: codegen
    app.kubernetes.io/instance: codegen
    app.kubernetes.io/version: "v1.0"
    app.kubernetes.io/managed-by: Helm
    app: codegen
 spec:
  replicas: 1
  selector:
    matchLabels:
      app.kubernetes.io/name: codegen
      app.kubernetes.io/instance: codegen
      app: codegen
  template:
    metadata:
      labels:
        app.kubernetes.io/name: codegen
        app.kubernetes.io/instance: codegen
        app: codegen
    spec:
      securityContext:
        null
      containers:
        - name: codegen
          env:
            - name: LLM_SERVICE_HOST_IP
              value: codegen-llm-uservice
            #- name: MEGA_SERVICE_PORT
            #  value: 7778
          securityContext:
            allowPrivilegeEscalation: false
            capabilities:
              drop:
              - ALL
            readOnlyRootFilesystem: true
            runAsNonRoot: true
            runAsUser: 1000
            seccompProfile:
              type: RuntimeDefault
          image: "opea/codegen:latest"
          imagePullPolicy: IfNotPresent
          volumeMounts:
            - mountPath: /tmp
              name: tmp
          ports:
            - name: codegen
              containerPort: 7778
              protocol: TCP
          resources:
            null
      volumes:
        - name: tmp
          emptyDir: {}
 ---
 # Source: codegen/templates/nginx-deployment.yaml
 apiVersion: apps/v1
 kind: Deployment
 metadata:
  name: codegen-nginx
  labels:
    helm.sh/chart: codegen-1.0.0
    app.kubernetes.io/name: codegen
    app.kubernetes.io/instance: codegen
    app.kubernetes.io/version: "v1.0"
    app.kubernetes.io/managed-by: Helm
    app: codegen-nginx
 spec:
  selector:
    matchLabels:
      app.kubernetes.io/name: codegen
      app.kubernetes.io/instance: codegen
      app: codegen-nginx
  template:
    metadata:
      labels:
        app.kubernetes.io/name: codegen
        app.kubernetes.io/instance: codegen
        app: codegen-nginx
    spec:
      containers:
      - image: nginx:1.27.1
        imagePullPolicy: IfNotPresent
        name: nginx
        volumeMounts:
        - mountPath: /etc/nginx/conf.d
          name: nginx-config-volume
      securityContext: {}
      volumes:
      - configMap:
          defaultMode: 420
          name: codegen-nginx-config
        name: nginx-config-volume
--- a/CodeGen/kubernetes/intel/cpu/xeon/manifest/codegen_react_ui.yaml
+++ b/CodeGen/kubernetes/intel/cpu/xeon/manifest/codegen_react_ui.yaml
@@ -1,282 +0,0 @@
 ---
 # Source: codegen/charts/llm-uservice/charts/tgi/templates/service.yaml
 # Copyright (C) 2024 Intel Corporation
 # SPDX-License-Identifier: Apache-2.0
 apiVersion: v1
 kind: Service
 metadata:
  name: codegen-tgi
  labels:
    helm.sh/chart: tgi-0.1.0
    app.kubernetes.io/name: tgi
    app.kubernetes.io/instance: codegen
    app.kubernetes.io/version: "1.4"
    app.kubernetes.io/managed-by: Helm
 spec:
  type: ClusterIP
  ports:
    - port: 80
      targetPort: 80
      protocol: TCP
      name: tgi
  selector:
    app.kubernetes.io/name: tgi
    app.kubernetes.io/instance: codegen
 ---
 apiVersion: v1
 kind: Service
 metadata:
  name: codegen-llm-uservice
  labels:
    helm.sh/chart: llm-uservice-0.1.0
    app.kubernetes.io/name: llm-uservice
    app.kubernetes.io/instance: codegen
    app.kubernetes.io/version: "1.0.0"
    app.kubernetes.io/managed-by: Helm
 spec:
  type: ClusterIP
  ports:
    - port: 9000
      targetPort: 9000
      protocol: TCP
      name: llm-uservice
  selector:
    app.kubernetes.io/name: llm-uservice
    app.kubernetes.io/instance: codegen
 ---
 apiVersion: v1
 kind: Service
 metadata:
  name: codegen
  labels:
    helm.sh/chart: codegen-0.1.0
    app.kubernetes.io/name: codegen
    app.kubernetes.io/instance: codegen
    app.kubernetes.io/version: "1.0.0"
    app.kubernetes.io/managed-by: Helm
 spec:
  type: ClusterIP
  ports:
    - port: 7778
      targetPort: 7778
      protocol: TCP
      name: codegen
  selector:
    app.kubernetes.io/name: codegen
    app.kubernetes.io/instance: codegen
 ---
 apiVersion: v1
 kind: Service
 metadata:
  name: codegen-react-ui
  labels:
    helm.sh/chart: codegen-react-ui-0.1.0
    app.kubernetes.io/name: react-ui
    app.kubernetes.io/instance: codegen
    app.kubernetes.io/version: "1.0.0"
    app.kubernetes.io/managed-by: Helm
 spec:
  type: ClusterIP
  ports:
    - port: 80
      targetPort: 80
      protocol: TCP
      name: react-ui
  selector:
    app.kubernetes.io/name: react-ui
    app.kubernetes.io/instance: codegen
 ---
 apiVersion: apps/v1
 kind: Deployment
 metadata:
  name: codegen-tgi
  labels:
    helm.sh/chart: tgi-0.1.0
    app.kubernetes.io/name: tgi
    app.kubernetes.io/instance: codegen
    app.kubernetes.io/version: "1.4"
    app.kubernetes.io/managed-by: Helm
 spec:
  replicas: 1
  selector:
    matchLabels:
      app.kubernetes.io/name: tgi
      app.kubernetes.io/instance: codegen
  template:
    metadata:
      labels:
        app.kubernetes.io/name: tgi
        app.kubernetes.io/instance: codegen
    spec:
      securityContext: {}
      containers:
        - name: tgi
          env:
            - name: MODEL_ID
              value: ise-uiuc/Magicoder-S-DS-6.7B
            - name: PORT
              value: "80"
            - name: CUDA_GRAPHS
              value: "0"
            - name: http_proxy
              value:
            - name: https_proxy
              value:
            - name: no_proxy
              value:
          securityContext: {}
          image: "ghcr.io/huggingface/text-generation-inference:2.4.0-intel-cpu"
          imagePullPolicy: IfNotPresent
          volumeMounts:
            - mountPath: /data
              name: model-volume
          ports:
            - name: http
              containerPort: 80
              protocol: TCP
          resources: {}
      volumes:
        - name: model-volume
          hostPath:
            path: /mnt
            type: Directory
 ---
 apiVersion: apps/v1
 kind: Deployment
 metadata:
  name: codegen-llm-uservice
  labels:
    helm.sh/chart: llm-uservice-0.1.0
    app.kubernetes.io/name: llm-uservice
    app.kubernetes.io/instance: codegen
    app.kubernetes.io/version: "1.0.0"
    app.kubernetes.io/managed-by: Helm
 spec:
  replicas: 1
  selector:
    matchLabels:
      app.kubernetes.io/name: llm-uservice
      app.kubernetes.io/instance: codegen
  template:
    metadata:
      labels:
        app.kubernetes.io/name: llm-uservice
        app.kubernetes.io/instance: codegen
    spec:
      securityContext: {}
      containers:
        - name: codegen
          env:
            - name: TGI_LLM_ENDPOINT
              value: "http://codegen-tgi:80"
            - name: HUGGINGFACEHUB_API_TOKEN
              value: "insert-your-huggingface-token-here"
            - name: http_proxy
              value:
            - name: https_proxy
              value:
            - name: no_proxy
              value:
          securityContext: {}
          image: "opea/llm-textgen:latest"
          imagePullPolicy: IfNotPresent
          ports:
            - name: llm-uservice
              containerPort: 9000
              protocol: TCP
          startupProbe:
            exec:
              command:
                - curl
                - http://codegen-tgi:80
            initialDelaySeconds: 5
            periodSeconds: 5
            failureThreshold: 120
          resources: {}
 ---
 apiVersion: apps/v1
 kind: Deployment
 metadata:
  name: codegen
  labels:
    helm.sh/chart: codegen-0.1.0
    app.kubernetes.io/name: codegen
    app.kubernetes.io/instance: codegen
    app.kubernetes.io/version: "1.0.0"
    app.kubernetes.io/managed-by: Helm
 spec:
  replicas: 1
  selector:
    matchLabels:
      app.kubernetes.io/name: codegen
      app.kubernetes.io/instance: codegen
  template:
    metadata:
      labels:
        app.kubernetes.io/name: codegen
        app.kubernetes.io/instance: codegen
    spec:
      securityContext: null
      containers:
        - name: codegen
          env:
            - name: LLM_SERVICE_HOST_IP
              value: codegen-llm-uservice
            - name: http_proxy
              value:
            - name: https_proxy
              value:
            - name: no_proxy
              value:
          securityContext: null
          image: "opea/codegen:latest"
          imagePullPolicy: IfNotPresent
          ports:
            - name: codegen
              containerPort: 7778
              protocol: TCP
          resources: null
 ---
 apiVersion: apps/v1
 kind: Deployment
 metadata:
  name: codegen-react-ui
  labels:
    helm.sh/chart: codegen-react-ui-0.1.0
    app.kubernetes.io/name: react-ui
    app.kubernetes.io/instance: codegen
    app.kubernetes.io/version: "1.0.0"
    app.kubernetes.io/managed-by: Helm
 spec:
  replicas: 1
  selector:
    matchLabels:
      app.kubernetes.io/name: react-ui
      app.kubernetes.io/instance: codegen
  template:
    metadata:
      labels:
        app.kubernetes.io/name: react-ui
        app.kubernetes.io/instance: codegen
    spec:
      securityContext: null
      containers:
        - name: codegen-react-ui
          env:
            - name: BASIC_URL
              value: "http://codegen:7778/v1/codegen"
            - name: http_proxy
              value:
            - name: https_proxy
              value:
            - name: no_proxy
              value:
          securityContext: null
          image: "opea/codegen-react-ui:latest"
          imagePullPolicy: IfNotPresent
          ports:
            - name: react-ui
              containerPort: 80
              protocol: TCP
          resources: null
--- a/CodeGen/kubernetes/intel/hpu/gaudi/manifest/codegen.yaml
+++ b/CodeGen/kubernetes/intel/hpu/gaudi/manifest/codegen.yaml
@@ -1,547 +0,0 @@
 ---
 # Source: codegen/charts/codegen-ui/templates/configmap.yaml
 # Copyright (C) 2024 Intel Corporation
 # SPDX-License-Identifier: Apache-2.0
 apiVersion: v1
 kind: ConfigMap
 metadata:
  name: codegen-codegen-ui-config
  labels:
    helm.sh/chart: codegen-ui-1.0.0
    app.kubernetes.io/name: codegen-ui
    app.kubernetes.io/instance: codegen
    app.kubernetes.io/version: "v1.0"
    app.kubernetes.io/managed-by: Helm
 data:
  APP_BACKEND_SERVICE_ENDPOINT: "/v1/codegen"
  APP_DATA_PREP_SERVICE_URL: "/v1/dataprep"
  CHAT_BASE_URL: "/v1/codegen"
  UPLOAD_FILE_BASE_URL: "/v1/dataprep"
  GET_FILE: "/v1/dataprep/get_file"
  DELETE_FILE: "/v1/dataprep/delete_file"
  BASE_URL: "/v1/codegen"
  DOC_BASE_URL: "/v1/codegen"
  BASIC_URL: "/v1/codegen"
  VITE_CODE_GEN_URL: "/v1/codegen"
  VITE_DOC_SUM_URL: "/v1/codegen"
 ---
 # Source: codegen/charts/llm-uservice/templates/configmap.yaml
 # Copyright (C) 2024 Intel Corporation
 # SPDX-License-Identifier: Apache-2.0
 apiVersion: v1
 kind: ConfigMap
 metadata:
  name: codegen-llm-uservice-config
  labels:
    helm.sh/chart: llm-uservice-1.0.0
    app.kubernetes.io/name: llm-uservice
    app.kubernetes.io/instance: codegen
    app.kubernetes.io/version: "v1.0"
    app.kubernetes.io/managed-by: Helm
 data:
  TGI_LLM_ENDPOINT: "http://codegen-tgi"
  HUGGINGFACEHUB_API_TOKEN: "insert-your-huggingface-token-here"
  HF_HOME: "/tmp/.cache/huggingface"
  http_proxy: ""
  https_proxy: ""
  no_proxy: ""
  LOGFLAG: ""
 ---
 # Source: codegen/charts/tgi/templates/configmap.yaml
 # Copyright (C) 2024 Intel Corporation
 # SPDX-License-Identifier: Apache-2.0
 apiVersion: v1
 kind: ConfigMap
 metadata:
  name: codegen-tgi-config
  labels:
    helm.sh/chart: tgi-1.0.0
    app.kubernetes.io/name: tgi
    app.kubernetes.io/instance: codegen
    app.kubernetes.io/version: "2.1.0"
    app.kubernetes.io/managed-by: Helm
 data:
  MODEL_ID: "Qwen/Qwen2.5-Coder-7B-Instruct"
  PORT: "2080"
  HF_TOKEN: "insert-your-huggingface-token-here"
  http_proxy: ""
  https_proxy: ""
  no_proxy: ""
  HABANA_LOGS: "/tmp/habana_logs"
  NUMBA_CACHE_DIR: "/tmp"
  HF_HOME: "/tmp/.cache/huggingface"
  MAX_INPUT_LENGTH: "1024"
  MAX_TOTAL_TOKENS: "2048"
 ---
 # Source: codegen/templates/nginx-deployment.yaml
 apiVersion: v1
 data:
  default.conf: |+
    # Copyright (C) 2024 Intel Corporation
    # SPDX-License-Identifier: Apache-2.0
    server {
        listen       80;
        listen  [::]:80;
        location /home {
            alias  /usr/share/nginx/html/index.html;
        }
        location / {
            proxy_pass http://codegen-codegen-ui:5174;
            proxy_set_header Host $host;
            proxy_set_header X-Real-IP $remote_addr;
            proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
            proxy_set_header X-Forwarded-Proto $scheme;
        }
        location /v1/codegen {
            proxy_pass http://codegen:7778;
            proxy_set_header Host $host;
            proxy_set_header X-Real-IP $remote_addr;
            proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
            proxy_set_header X-Forwarded-Proto $scheme;
        }
    }
 kind: ConfigMap
 metadata:
  name: codegen-nginx-config
 ---
 # Source: codegen/charts/codegen-ui/templates/service.yaml
 # Copyright (C) 2024 Intel Corporation
 # SPDX-License-Identifier: Apache-2.0
 apiVersion: v1
 kind: Service
 metadata:
  name: codegen-codegen-ui
  labels:
    helm.sh/chart: codegen-ui-1.0.0
    app.kubernetes.io/name: codegen-ui
    app.kubernetes.io/instance: codegen
    app.kubernetes.io/version: "v1.0"
    app.kubernetes.io/managed-by: Helm
 spec:
  type: ClusterIP
  ports:
    - port: 5174
      targetPort: ui
      protocol: TCP
      name: ui
  selector:
    app.kubernetes.io/name: codegen-ui
    app.kubernetes.io/instance: codegen
 ---
 # Source: codegen/charts/llm-uservice/templates/service.yaml
 # Copyright (C) 2024 Intel Corporation
 # SPDX-License-Identifier: Apache-2.0
 apiVersion: v1
 kind: Service
 metadata:
  name: codegen-llm-uservice
  labels:
    helm.sh/chart: llm-uservice-1.0.0
    app.kubernetes.io/name: llm-uservice
    app.kubernetes.io/instance: codegen
    app.kubernetes.io/version: "v1.0"
    app.kubernetes.io/managed-by: Helm
 spec:
  type: ClusterIP
  ports:
    - port: 9000
      targetPort: 9000
      protocol: TCP
      name: llm-uservice
  selector:
    app.kubernetes.io/name: llm-uservice
    app.kubernetes.io/instance: codegen
 ---
 # Source: codegen/charts/tgi/templates/service.yaml
 # Copyright (C) 2024 Intel Corporation
 # SPDX-License-Identifier: Apache-2.0
 apiVersion: v1
 kind: Service
 metadata:
  name: codegen-tgi
  labels:
    helm.sh/chart: tgi-1.0.0
    app.kubernetes.io/name: tgi
    app.kubernetes.io/instance: codegen
    app.kubernetes.io/version: "2.1.0"
    app.kubernetes.io/managed-by: Helm
 spec:
  type: ClusterIP
  ports:
    - port: 80
      targetPort: 2080
      protocol: TCP
      name: tgi
  selector:
    app.kubernetes.io/name: tgi
    app.kubernetes.io/instance: codegen
 ---
 # Source: codegen/templates/nginx-deployment.yaml
 apiVersion: v1
 kind: Service
 metadata:
  name: codegen-nginx
 spec:
  ports:
  - port: 80
    protocol: TCP
    targetPort: 80
  selector:
    app.kubernetes.io/name: codegen
    app.kubernetes.io/instance: codegen
    app: codegen-nginx
  type: NodePort
 ---
 # Source: codegen/templates/service.yaml
 # Copyright (C) 2024 Intel Corporation
 # SPDX-License-Identifier: Apache-2.0
 apiVersion: v1
 kind: Service
 metadata:
  name: codegen
  labels:
    helm.sh/chart: codegen-1.0.0
    app.kubernetes.io/name: codegen
    app.kubernetes.io/instance: codegen
    app.kubernetes.io/version: "v1.0"
    app.kubernetes.io/managed-by: Helm
 spec:
  type: ClusterIP
  ports:
    - port: 7778
      targetPort: 7778
      protocol: TCP
      name: codegen
  selector:
    app.kubernetes.io/name: codegen
    app.kubernetes.io/instance: codegen
    app: codegen
 ---
 # Source: codegen/charts/codegen-ui/templates/deployment.yaml
 # Copyright (C) 2024 Intel Corporation
 # SPDX-License-Identifier: Apache-2.0
 apiVersion: apps/v1
 kind: Deployment
 metadata:
  name: codegen-codegen-ui
  labels:
    helm.sh/chart: codegen-ui-1.0.0
    app.kubernetes.io/name: codegen-ui
    app.kubernetes.io/instance: codegen
    app.kubernetes.io/version: "v1.0"
    app.kubernetes.io/managed-by: Helm
 spec:
  replicas: 1
  selector:
    matchLabels:
      app.kubernetes.io/name: codegen-ui
      app.kubernetes.io/instance: codegen
  template:
    metadata:
      labels:
        helm.sh/chart: codegen-ui-1.0.0
        app.kubernetes.io/name: codegen-ui
        app.kubernetes.io/instance: codegen
        app.kubernetes.io/version: "v1.0"
        app.kubernetes.io/managed-by: Helm
    spec:
      securityContext:
        {}
      containers:
        - name: codegen-ui
          envFrom:
            - configMapRef:
                name: codegen-codegen-ui-config
          securityContext:
            {}
          image: "opea/codegen-ui:latest"
          imagePullPolicy: IfNotPresent
          ports:
            - name: ui
              containerPort: 5173
              protocol: TCP
          resources:
            {}
          volumeMounts:
            - mountPath: /tmp
              name: tmp
      volumes:
        - name: tmp
          emptyDir: {}
 ---
 # Source: codegen/charts/llm-uservice/templates/deployment.yaml
 # Copyright (C) 2024 Intel Corporation
 # SPDX-License-Identifier: Apache-2.0
 apiVersion: apps/v1
 kind: Deployment
 metadata:
  name: codegen-llm-uservice
  labels:
    helm.sh/chart: llm-uservice-1.0.0
    app.kubernetes.io/name: llm-uservice
    app.kubernetes.io/instance: codegen
    app.kubernetes.io/version: "v1.0"
    app.kubernetes.io/managed-by: Helm
 spec:
  replicas: 1
  selector:
    matchLabels:
      app.kubernetes.io/name: llm-uservice
      app.kubernetes.io/instance: codegen
  template:
    metadata:
      labels:
        app.kubernetes.io/name: llm-uservice
        app.kubernetes.io/instance: codegen
    spec:
      securityContext:
        {}
      containers:
        - name: codegen
          envFrom:
            - configMapRef:
                name: codegen-llm-uservice-config
          securityContext:
            allowPrivilegeEscalation: false
            capabilities:
              drop:
              - ALL
            readOnlyRootFilesystem: false
            runAsNonRoot: true
            runAsUser: 1000
            seccompProfile:
              type: RuntimeDefault
          image: "opea/llm-textgen:latest"
          imagePullPolicy: IfNotPresent
          ports:
            - name: llm-uservice
              containerPort: 9000
              protocol: TCP
          volumeMounts:
            - mountPath: /tmp
              name: tmp
          livenessProbe:
            failureThreshold: 24
            httpGet:
              path: v1/health_check
              port: llm-uservice
            initialDelaySeconds: 5
            periodSeconds: 5
          readinessProbe:
            httpGet:
              path: v1/health_check
              port: llm-uservice
            initialDelaySeconds: 5
            periodSeconds: 5
          startupProbe:
            failureThreshold: 120
            httpGet:
              path: v1/health_check
              port: llm-uservice
            initialDelaySeconds: 5
            periodSeconds: 5
          resources:
            {}
      volumes:
        - name: tmp
          emptyDir: {}
 ---
 # Source: codegen/charts/tgi/templates/deployment.yaml
 # Copyright (C) 2024 Intel Corporation
 # SPDX-License-Identifier: Apache-2.0
 apiVersion: apps/v1
 kind: Deployment
 metadata:
  name: codegen-tgi
  labels:
    helm.sh/chart: tgi-1.0.0
    app.kubernetes.io/name: tgi
    app.kubernetes.io/instance: codegen
    app.kubernetes.io/version: "2.1.0"
    app.kubernetes.io/managed-by: Helm
 spec:
  # use explicit replica counts only of HorizontalPodAutoscaler is disabled
  replicas: 1
  selector:
    matchLabels:
      app.kubernetes.io/name: tgi
      app.kubernetes.io/instance: codegen
  template:
    metadata:
      labels:
        app.kubernetes.io/name: tgi
        app.kubernetes.io/instance: codegen
    spec:
      securityContext:
        {}
      containers:
        - name: tgi
          envFrom:
            - configMapRef:
                name: codegen-tgi-config
          securityContext:
            allowPrivilegeEscalation: false
            capabilities:
              drop:
              - ALL
            readOnlyRootFilesystem: true
            runAsNonRoot: true
            runAsUser: 1000
            seccompProfile:
              type: RuntimeDefault
          image: "ghcr.io/huggingface/tgi-gaudi:2.0.6"
          imagePullPolicy: IfNotPresent
          volumeMounts:
            - mountPath: /data
              name: model-volume
            - mountPath: /tmp
              name: tmp
          ports:
            - name: http
              containerPort: 2080
              protocol: TCP
          livenessProbe:
            failureThreshold: 24
            initialDelaySeconds: 5
            periodSeconds: 5
            tcpSocket:
              port: http
          readinessProbe:
            initialDelaySeconds: 5
            periodSeconds: 5
            tcpSocket:
              port: http
          startupProbe:
            failureThreshold: 120
            initialDelaySeconds: 5
            periodSeconds: 5
            tcpSocket:
              port: http
          resources:
            limits:
              habana.ai/gaudi: 1
              memory: 64Gi
              hugepages-2Mi: 500Mi
      volumes:
        - name: model-volume
          emptyDir: {}
        - name: tmp
          emptyDir: {}
 ---
 # Source: codegen/templates/deployment.yaml
 # Copyright (C) 2024 Intel Corporation
 # SPDX-License-Identifier: Apache-2.0
 apiVersion: apps/v1
 kind: Deployment
 metadata:
  name: codegen
  labels:
    helm.sh/chart: codegen-1.0.0
    app.kubernetes.io/name: codegen
    app.kubernetes.io/instance: codegen
    app.kubernetes.io/version: "v1.0"
    app.kubernetes.io/managed-by: Helm
    app: codegen
 spec:
  replicas: 1
  selector:
    matchLabels:
      app.kubernetes.io/name: codegen
      app.kubernetes.io/instance: codegen
      app: codegen
  template:
    metadata:
      labels:
        app.kubernetes.io/name: codegen
        app.kubernetes.io/instance: codegen
        app: codegen
    spec:
      securityContext:
        null
      containers:
        - name: codegen
          env:
            - name: LLM_SERVICE_HOST_IP
              value: codegen-llm-uservice
            #- name: MEGA_SERVICE_PORT
            #  value: 7778
          securityContext:
            allowPrivilegeEscalation: false
            capabilities:
              drop:
              - ALL
            readOnlyRootFilesystem: true
            runAsNonRoot: true
            runAsUser: 1000
            seccompProfile:
              type: RuntimeDefault
          image: "opea/codegen:latest"
          imagePullPolicy: IfNotPresent
          volumeMounts:
            - mountPath: /tmp
              name: tmp
          ports:
            - name: codegen
              containerPort: 7778
              protocol: TCP
          resources:
            null
      volumes:
        - name: tmp
          emptyDir: {}
 ---
 # Source: codegen/templates/nginx-deployment.yaml
 apiVersion: apps/v1
 kind: Deployment
 metadata:
  name: codegen-nginx
  labels:
    helm.sh/chart: codegen-1.0.0
    app.kubernetes.io/name: codegen
    app.kubernetes.io/instance: codegen
    app.kubernetes.io/version: "v1.0"
    app.kubernetes.io/managed-by: Helm
    app: codegen-nginx
 spec:
  selector:
    matchLabels:
      app.kubernetes.io/name: codegen
      app.kubernetes.io/instance: codegen
      app: codegen-nginx
  template:
    metadata:
      labels:
        app.kubernetes.io/name: codegen
        app.kubernetes.io/instance: codegen
        app: codegen-nginx
    spec:
      containers:
      - image: nginx:1.27.1
        imagePullPolicy: IfNotPresent
        name: nginx
        volumeMounts:
        - mountPath: /etc/nginx/conf.d
          name: nginx-config-volume
      securityContext: {}
      volumes:
      - configMap:
          defaultMode: 420
          name: codegen-nginx-config
        name: nginx-config-volume
--- a/CodeGen/tests/test_gmc_on_gaudi.sh
+++ b/CodeGen/tests/test_gmc_on_gaudi.sh
@@ -112,12 +112,12 @@ fi
 case "$1" in
    install_CodeGen)
-        pushd CodeGen/kubernetes/intel/hpu/gaudi/gmc
+        pushd CodeGen/kubernetes/gmc
        install_codegen
        popd
        ;;
    validate_CodeGen)
-        pushd CodeGen/kubernetes/intel/hpu/gaudi/gmc
+        pushd CodeGen/kubernetes/gmc
        validate_codegen
        popd
        ;;
--- a/CodeGen/tests/test_gmc_on_xeon.sh
+++ b/CodeGen/tests/test_gmc_on_xeon.sh
@@ -112,12 +112,12 @@ fi
 case "$1" in
    install_CodeGen)
-        pushd CodeGen/kubernetes/intel/cpu/xeon/gmc
+        pushd CodeGen/kubernetes/gmc
        install_codegen
        popd
        ;;
    validate_CodeGen)
-        pushd CodeGen/kubernetes/intel/cpu/xeon/gmc
+        pushd CodeGen/kubernetes/gmc
        validate_codegen
        popd
        ;;
--- a/README.md
+++ b/README.md
@@ -43,19 +43,19 @@ Deployment are based on released docker images by default, check [docker image l
 #### Deploy Examples
-| Use Case          | Docker Compose<br/>Deployment on Xeon                                          | Docker Compose<br/>Deployment on Gaudi                                       | Kubernetes with Manifests                                                        | Kubernetes with Helm Charts                                                                                        | Kubernetes with GMC                                                |
+| Use Case          | Docker Compose<br/>Deployment on Xeon                                          | Docker Compose<br/>Deployment on Gaudi                                       | Kubernetes with Helm Charts                                                                                        | Kubernetes with GMC                                                |
-| ----------------- | ------------------------------------------------------------------------------ | ---------------------------------------------------------------------------- | -------------------------------------------------------------------------------- | ------------------------------------------------------------------------------------------------------------------ | ------------------------------------------------------------------ |
+| ----------------- | ------------------------------------------------------------------------------ | ---------------------------------------------------------------------------- | ------------------------------------------------------------------------------------------------------------------ | ------------------------------------------------------------------ |
-| ChatQnA           | [Xeon Instructions](ChatQnA/docker_compose/intel/cpu/xeon/README.md)           | [Gaudi Instructions](ChatQnA/docker_compose/intel/hpu/gaudi/README.md)       | [ChatQnA with Manifests](ChatQnA/kubernetes/intel/README.md)                     | [ChatQnA with Helm Charts](https://github.com/opea-project/GenAIInfra/tree/main/helm-charts/chatqna/README.md)     | [ChatQnA with GMC](ChatQnA/kubernetes/intel/README_gmc.md)         |
+| ChatQnA           | [Xeon Instructions](ChatQnA/docker_compose/intel/cpu/xeon/README.md)           | [Gaudi Instructions](ChatQnA/docker_compose/intel/hpu/gaudi/README.md)       | [ChatQnA with Helm Charts](https://github.com/opea-project/GenAIInfra/tree/main/helm-charts/chatqna/README.md)     | [ChatQnA with GMC](ChatQnA/kubernetes/intel/README_gmc.md)         |
-| CodeGen           | [Xeon Instructions](CodeGen/docker_compose/intel/cpu/xeon/README.md)           | [Gaudi Instructions](CodeGen/docker_compose/intel/hpu/gaudi/README.md)       | [CodeGen with Manifests](CodeGen/kubernetes/intel/README.md)                     | [CodeGen with Helm Charts](https://github.com/opea-project/GenAIInfra/tree/main/helm-charts/codegen/README.md)     | [CodeGen with GMC](CodeGen/kubernetes/intel/README_gmc.md)         |
+| CodeGen           | [Xeon Instructions](CodeGen/docker_compose/intel/cpu/xeon/README.md)           | [Gaudi Instructions](CodeGen/docker_compose/intel/hpu/gaudi/README.md)       | [CodeGen with Helm Charts](https://github.com/opea-project/GenAIInfra/tree/main/helm-charts/codegen/README.md)     | [CodeGen with GMC](CodeGen/kubernetes/gmc/README.md)               |
-| CodeTrans         | [Xeon Instructions](CodeTrans/docker_compose/intel/cpu/xeon/README.md)         | [Gaudi Instructions](CodeTrans/docker_compose/intel/hpu/gaudi/README.md)     | [CodeTrans with Manifests](CodeTrans/kubernetes/intel/README.md)                 | [CodeTrans with Helm Charts](https://github.com/opea-project/GenAIInfra/tree/main/helm-charts/codetrans/README.md) | [CodeTrans with GMC](CodeTrans/kubernetes/intel/README_gmc.md)     |
+| CodeTrans         | [Xeon Instructions](CodeTrans/docker_compose/intel/cpu/xeon/README.md)         | [Gaudi Instructions](CodeTrans/docker_compose/intel/hpu/gaudi/README.md)     | [CodeTrans with Helm Charts](https://github.com/opea-project/GenAIInfra/tree/main/helm-charts/codetrans/README.md) | [CodeTrans with GMC](CodeTrans/kubernetes/intel/README_gmc.md)     |
-| DocSum            | [Xeon Instructions](DocSum/docker_compose/intel/cpu/xeon/README.md)            | [Gaudi Instructions](DocSum/docker_compose/intel/hpu/gaudi/README.md)        | [DocSum with Manifests](DocSum/kubernetes/intel/README.md)                       | [DocSum with Helm Charts](https://github.com/opea-project/GenAIInfra/tree/main/helm-charts/docsum/README.md)       | [DocSum with GMC](DocSum/kubernetes/intel/README_gmc.md)           |
+| DocSum            | [Xeon Instructions](DocSum/docker_compose/intel/cpu/xeon/README.md)            | [Gaudi Instructions](DocSum/docker_compose/intel/hpu/gaudi/README.md)        | [DocSum with Helm Charts](https://github.com/opea-project/GenAIInfra/tree/main/helm-charts/docsum/README.md)       | [DocSum with GMC](DocSum/kubernetes/intel/README_gmc.md)           |
-| SearchQnA         | [Xeon Instructions](SearchQnA/docker_compose/intel/cpu/xeon/README.md)         | [Gaudi Instructions](SearchQnA/docker_compose/intel/hpu/gaudi/README.md)     | Not Supported                                                                    | Not Supported                                                                                                      | [SearchQnA with GMC](SearchQnA/kubernetes/intel/README_gmc.md)     |
+| SearchQnA         | [Xeon Instructions](SearchQnA/docker_compose/intel/cpu/xeon/README.md)         | [Gaudi Instructions](SearchQnA/docker_compose/intel/hpu/gaudi/README.md)     | Not Supported                                                                                                      | [SearchQnA with GMC](SearchQnA/kubernetes/intel/README_gmc.md)     |
-| FaqGen            | [Xeon Instructions](FaqGen/docker_compose/intel/cpu/xeon/README.md)            | [Gaudi Instructions](FaqGen/docker_compose/intel/hpu/gaudi/README.md)        | [FaqGen with Manifests](FaqGen/kubernetes/intel/README.md)                       | Not Supported                                                                                                      | [FaqGen with GMC](FaqGen/kubernetes/intel/README_gmc.md)           |
+| FaqGen            | [Xeon Instructions](FaqGen/docker_compose/intel/cpu/xeon/README.md)            | [Gaudi Instructions](FaqGen/docker_compose/intel/hpu/gaudi/README.md)        | Not Supported                                                                                                      | [FaqGen with GMC](FaqGen/kubernetes/intel/README_gmc.md)           |
-| Translation       | [Xeon Instructions](Translation/docker_compose/intel/cpu/xeon/README.md)       | [Gaudi Instructions](Translation/docker_compose/intel/hpu/gaudi/README.md)   | [Translation with Manifests](Translation/kubernetes/intel/README.md)             | Not Supported                                                                                                      | [Translation with GMC](Translation/kubernetes/intel/README_gmc.md) |
+| Translation       | [Xeon Instructions](Translation/docker_compose/intel/cpu/xeon/README.md)       | [Gaudi Instructions](Translation/docker_compose/intel/hpu/gaudi/README.md)   | Not Supported                                                                                                      | [Translation with GMC](Translation/kubernetes/intel/README_gmc.md) |
-| AudioQnA          | [Xeon Instructions](AudioQnA/docker_compose/intel/cpu/xeon/README.md)          | [Gaudi Instructions](AudioQnA/docker_compose/intel/hpu/gaudi/README.md)      | [AudioQnA with Manifests](AudioQnA/kubernetes/intel/README.md)                   | Not Supported                                                                                                      | [AudioQnA with GMC](AudioQnA/kubernetes/intel/README_gmc.md)       |
+| AudioQnA          | [Xeon Instructions](AudioQnA/docker_compose/intel/cpu/xeon/README.md)          | [Gaudi Instructions](AudioQnA/docker_compose/intel/hpu/gaudi/README.md)      | Not Supported                                                                                                      | [AudioQnA with GMC](AudioQnA/kubernetes/intel/README_gmc.md)       |
-| VisualQnA         | [Xeon Instructions](VisualQnA/docker_compose/intel/cpu/xeon/README.md)         | [Gaudi Instructions](VisualQnA/docker_compose/intel/hpu/gaudi/README.md)     | [VisualQnA with Manifests](VisualQnA/kubernetes/intel/README.md)                 | Not Supported                                                                                                      | [VisualQnA with GMC](VisualQnA/kubernetes/intel/README_gmc.md)     |
+| VisualQnA         | [Xeon Instructions](VisualQnA/docker_compose/intel/cpu/xeon/README.md)         | [Gaudi Instructions](VisualQnA/docker_compose/intel/hpu/gaudi/README.md)     | Not Supported                                                                                                      | [VisualQnA with GMC](VisualQnA/kubernetes/intel/README_gmc.md)     |
-| MultimodalQnA     | [Xeon Instructions](MultimodalQnA/docker_compose/intel/cpu/xeon/README.md)     | [Gaudi Instructions](MultimodalQnA/docker_compose/intel/hpu/gaudi/README.md) | Not supported                                                                    | Not supported                                                                                                      | Not supported                                                      |
+| MultimodalQnA     | [Xeon Instructions](MultimodalQnA/docker_compose/intel/cpu/xeon/README.md)     | [Gaudi Instructions](MultimodalQnA/docker_compose/intel/hpu/gaudi/README.md) | Not supported                                                                                                      | Not supported                                                      |
-| ProductivitySuite | [Xeon Instructions](ProductivitySuite/docker_compose/intel/cpu/xeon/README.md) | Not Supported                                                                | [ProductivitySuite with Manifests](ProductivitySuite/kubernetes/intel/README.md) | Not Supported                                                                                                      | Not Supported                                                      |
+| ProductivitySuite | [Xeon Instructions](ProductivitySuite/docker_compose/intel/cpu/xeon/README.md) | Not Supported                                                                | Not Supported                                                                                                      | Not Supported                                                      |
 ## Supported Examples