Cómo montar una alternativa local a GitHub Copilot en VS Code

Cómo montar una alternativa local a GitHub Copilot en VS Code

por Raúl Unzué

Configura tu asistente de código local en VS Code con Ollama

Las herramientas de asistencia al desarrollo basadas en inteligencia artificial se han convertido en parte habitual del flujo de trabajo de muchos programadores.

Soluciones como GitHub Copilot o Cursor ofrecen autocompletado inteligente, chat contextual y generación de código prácticamente instantánea. El problema es que, para proporcionar esas capacidades, tu código suele procesarse en infraestructuras de terceros.

Para proyectos personales esto puede no ser un inconveniente. Para entornos empresariales, código propietario o desarrollos sujetos a acuerdos de confidencialidad, la situación cambia por completo.

La buena noticia es que hoy es posible construir una alternativa local sorprendentemente potente utilizando modelos open source, una GPU moderna y herramientas gratuitas.

En esta guía configuraremos un asistente de programación privado basado en Ollama, Continue y Qwen2.5-Coder capaz de ofrecer:

  • Autocompletado inteligente en tiempo real
  • Chat contextual dentro de VS Code
  • Refactorización asistida por IA (mejora de código sin tocar funcionalidad mediante IA)
  • Comprensión del repositorio completo
  • Procesamiento 100% local

Sin suscripciones mensuales.

Sin dependencias de proveedores externos.

Y sin que tu código abandone tu infraestructura.

GitHub Copilot vs Solución Local

Antes de empezar conviene entender qué estamos construyendo:

Característica

GitHub Copilot

Stack Local

Coste mensual

No

Código sale de tu red

No

Funciona sin Internet

No

Control del modelo

Limitado

Total

Modelos personalizables

Parcial

Completo

Instalación inicial

Muy simple

Media

No se trata de replicar exactamente todas las funcionalidades de Copilot Enterprise.

El objetivo es cubrir la mayoría de casos de uso diarios de un desarrollador manteniendo el control absoluto sobre los datos.

Montar un servidor local no implica que sea todo "gratis", tiene un coste altísimo de compra tal y como están los componentes hoy en día y otros gastos implícitos de tener el servidor encendido y depender de él para realizar ciertas tareas. A cambio, dispones del control total (con lo que ello implica también).

Arquitectura y Requisitos de la solución

La arquitectura es sencilla:

  1. VS Code envía el contexto de programación a Continue.
  2. Continue actúa como intermediario y se comunica con Ollama.
  3. Ollama ejecuta localmente los modelos especializados en generación y análisis de código.

    Geeknetic Cómo montar una alternativa local a GitHub Copilot en VS Code 1

Requisitos previos

Necesitarás:

  • VS Code instalado
  • Un servidor o equipo con Ollama funcionando
  • Una GPU moderna (recomendable)
  • Acceso de red entre VS Code y el servidor
  • Mínimo entre 10 y 15 GB de almacenamiento libre

No es necesario crear cuentas ni registrarse en ningún servicio.

Instalación de Modelos de Ollama y Extensión Continue en Visual Code

Para este ejemplo, usaremos un servidor Ubuntu Server + Ollama + GPU PNY RTX 2000 PRO 16GB Blackwell y una máquina para desarrollar con Windows 11 + Visual Code instalado:

Paso 1: Descargar los modelos

Para obtener una experiencia fluida utilizaremos dos modelos diferentes.

  • Uno para chat y análisis profundo:
ollama pull qwen2.5-coder:7b

Geeknetic Cómo montar una alternativa local a GitHub Copilot en VS Code 2

  • Y otro optimizado para autocompletado rápido:
ollama pull qwen2.5-coder:1.5b

Geeknetic Cómo montar una alternativa local a GitHub Copilot en VS Code 3

Esta separación tiene una ventaja importante.

  • El autocompletado se ejecuta constantemente mientras escribes, por lo que necesita tiempos de respuesta extremadamente bajos.
  • Las tareas de chat, refactorización o explicación de código toleran algo más de latencia y se benefician de modelos más grandes.

Si dispones de 12 GB o más de VRAM, considera utilizar:

ollama pull qwen2.5-coder:14b

Geeknetic Cómo montar una alternativa local a GitHub Copilot en VS Code 4

Comprueba que los modelos están disponibles:

ollama list

Geeknetic Cómo montar una alternativa local a GitHub Copilot en VS Code 5

Paso 2: Permitir conexiones desde la red local

Por defecto, Ollama escucha únicamente en localhost.

Si VS Code está instalado en otra máquina, debes exponer el servicio.

Edita la configuración:

sudo systemctl edit ollama

Añade:

[Service]

Environment="OLLAMA_HOST=0.0.0.0:11434"

Geeknetic Cómo montar una alternativa local a GitHub Copilot en VS Code 6

Aplica los cambios:

sudo systemctl daemon-reloadsudo systemctl restart ollama

Verifica desde la máquina Windows que puedes acceder:

curl http://IP_SERVIDOR:11434/api/tags

Geeknetic Cómo montar una alternativa local a GitHub Copilot en VS Code 7

Si no responde, revisa las reglas de firewall.

Paso 3: Instalar Continue

Continue es una de las extensiones más maduras para conectar modelos locales con VS Code.

Instalación:

  1. Abrir Extensions (Ctrl + Shift + X)

    Geeknetic Cómo montar una alternativa local a GitHub Copilot en VS Code 8

  2. Buscar "Continue"

    Geeknetic Cómo montar una alternativa local a GitHub Copilot en VS Code 9

  3. Instalar la extensión

    Geeknetic Cómo montar una alternativa local a GitHub Copilot en VS Code 10

    Pulsamos "Trust Publisher & Install":

    Geeknetic Cómo montar una alternativa local a GitHub Copilot en VS Code 11

  4. Reiniciar VS Code. Al abrir nuevamente verás un icono nuevo en el lateral:

    Geeknetic Cómo montar una alternativa local a GitHub Copilot en VS Code 12

 

Configurar Extensión Continue para IA Local

Continue, como hemos dicho, es la extensión que hace de puente entre VS Code y tu Ollama. Es open source, activa, y tiene mejor integración con modelos locales que cualquier alternativa que haya probado.

Una vez instalada la extensión, verás el icono de Continue en la barra lateral.

Seguiremos los siguientes pasos para la configuración:

  1. En VS Code, pulsa en el sobre el icono de la extensión:

    Geeknetic Cómo montar una alternativa local a GitHub Copilot en VS Code 13

  2. Despliega Local Config. Haz clic en el icono del engranaje "Local Config":

    Geeknetic Cómo montar una alternativa local a GitHub Copilot en VS Code 14

  3. Vamos a editar el fichero original config.yaml:

    Geeknetic Cómo montar una alternativa local a GitHub Copilot en VS Code 15

  4. Por este contenido, cambiando el nombre / IP del servidor:

    name: Local Config

    version: 1.0.0

    schema: v1

    models:

      - name: Qwen2.5-Coder 14B (Chat)

        provider: ollama

        model: qwen2.5-coder:14b

        apiBase: http://IP-SERVIDOR:11434

        contextLength: 16384

        systemMessage: "Eres un asistente de programación experto. Responde siempre en el mismo idioma en que te hagan la pregunta. Cuando generes código, incluye únicamente el código sin explicaciones adicionales a menos que te las pidan explícitamente."

        roles:

          - chat

          - edit

          - apply

    tabAutocompleteModel:

      name: Qwen Autocomplete 1.5B

      provider: ollama

      model: qwen2.5-coder:1.5b

      apiBase: http://IP-SERVIDOR:11434

      roles:

        - autocomplete

    Geeknetic Cómo montar una alternativa local a GitHub Copilot en VS Code 16

  5. Guardamos el fichero. Automáticamente dispondremos del modelo:

    Geeknetic Cómo montar una alternativa local a GitHub Copilot en VS Code 17

Primeras pruebas IA Local + VS Code

Para comprobar que todo el sistema (Chat + Autocompletado) funciona a la perfección, vamos a hacer una prueba real en VS Code.

Os dejo un script de Python que contiene malas prácticas, un bug y falta de tipado. Guarda este código en un archivo llamado prueba_ia.py:

# prueba_ia.py

def procesar_usuarios(lista_usuarios):

    # ERROR 1: Variable no inicializada / Bug de ejecución si la lista está vacía

    for u in lista_usuarios:

        if u['edad'] >= 18:

            # ERROR 2: Concatenación manual de strings (Mala práctica en Python)

            print("El usuario " + u['nombre'] + " es mayor de edad.")

            

    # ERROR 3: Retorna una variable 'total' que no existe si la lista no tiene datos

    return total

Geeknetic Cómo montar una alternativa local a GitHub Copilot en VS Code 18

Prueba 1: Comprobar el Chat

Vamos a probar el modelo grande (Qwen2.5-Coder 14B) para que analice y refactorice el código.

  1. En VS Code, abre el archivo prueba_ia.py
  2. Selecciona todo el código con Ctrl + A.
  3. Pulsa Ctrl + L. Verás que el código seleccionado se adjunta automáticamente al chat de Continue en la barra lateral.

    Geeknetic Cómo montar una alternativa local a GitHub Copilot en VS Code 19

  4. Escribe en el chat: "¿Qué errores ves en este código y cómo lo mejorarías?"

    Geeknetic Cómo montar una alternativa local a GitHub Copilot en VS Code 20

  5. Pulsa Enter.
  6. Qwen, si funciona bien, detectará los tres fallos principales y te devolverá una respuesta directa (cumpliendo tu directiva de no dar rodeos) con el código corregido:

Solución al Bug: Inicializará el contador total al principio de la función.

Solución a la Mala Práctica: Cambiará la concatenación rudimentaria por un f-string (f"El usuario {u['nombre']}..."), que es más eficiente y limpio en Python.

Mejora Técnica: Añadirá tipado estático (Type Hints) para que el código sea más profesional

Geeknetic Cómo montar una alternativa local a GitHub Copilot en VS Code 21

Si pasas el ratón por encima del bloque de código que te ha devuelto el chat de Continue, verás un botón que dice "Insert Code" o "Apply" (o el icono de una flecha hacia el documento). Si lo pulsas, sustituirá tu código viejo por el nuevo automáticamente.

Geeknetic Cómo montar una alternativa local a GitHub Copilot en VS Code 22

Prueba 2: Comprobar el Autocompletado en línea

Ahora vamos a comprobar que el modelo rápido (Qwen Autocomplete 1.5B) está trabajando mientras tecleas.

Antes de empezar con la prueba nos aseguramos que otras configuraciones de Visual Code no van a entrar en conflicto. Reiniciamos el motor interno de VS Code sin cerrar la ventana:

  1. Vuelve a pulsar Ctrl + Shift + P.
  2. Escribe: Developer: Restart Extension Host y dale a Enter.
  3. Verás que las extensiones se recargan por un segundo.

Con todo esto realizamos la prueba:

  1. Ve al final de tu archivo prueba_ia.py y crea una nueva línea.
  2. Empieza a escribir una función nueva para probar el código, por ejemplo, escribe despacio esto:

    test_procesar_usuarios():

  3. En cuanto pulses Intro y dejes el cursor en la línea de abajo, espera una fracción de segundo.
  4. Verás que aparece un texto sombreado en gris claro sugiriéndote la creación de una lista de usuarios de prueba y la llamada a la función.

    Geeknetic Cómo montar una alternativa local a GitHub Copilot en VS Code 23

  5. Pulsa la tecla Tabulador para aceptar la sugerencia.

Si ambas pruebas responden correctamente (el chat te genera el código limpio y el tabulador te autocompleta las líneas) ¡Enhorabuena! Tienes tu alternativa local y privada a GitHub Copilot rindiendo al 100%.

Limitaciones que debes conocer

Las soluciones locales han avanzado enormemente, pero conviene tener expectativas realistas.

  • Un modelo de 7B no compite con los mejores modelos cloud en tareas complejas de arquitectura.
  • Los repositorios muy grandes pueden requerir más memoria durante la indexación inicial.
  • Algunas integraciones empresariales de Copilot no tienen equivalente directo.
  • La calidad del resultado depende directamente del modelo utilizado.

Aun así, para desarrollo diario, generación de código, documentación, pruebas y refactorizaciones habituales, la experiencia es sorprendentemente competitiva.

Rendimiento esperado según la GPU

GPU

Chat

Autocompletado

Experiencia

RTX 3060 12GB

Fluido

Instantáneo

Muy buena

RTX 2000 Ada 16GB

Muy fluido

Instantáneo

Excelente

RTX 3090 24GB

Muy rápido

Instantáneo

Excelente

RTX 4090 24GB

Excelente

Instantáneo

Profesional

La diferencia principal se aprecia en el chat y en tareas complejas de refactorización.

El autocompletado suele ser extremadamente rápido incluso con hardware relativamente modesto.

IA para Programar en Local

La inteligencia artificial local ha alcanzado un punto de madurez donde ya puede sustituir gran parte del trabajo que muchos desarrolladores realizan con herramientas comerciales.

Para autocompletado, refactorización, comprensión de código heredado y generación de pruebas, una combinación de Ollama, Continue y Qwen2.5-Coder ofrece una experiencia excelente manteniendo el control total sobre los datos.

Si ya dispones de un servidor con GPU, el tiempo de despliegue completo suele ser inferior a treinta minutos.

Y una vez configurado, tendrás un asistente de programación privado, personalizable y sin costes recurrentes.

Para muchos equipos, esa combinación resulta difícil de superar.

Fin del Artículo. ¡Cuéntanos algo en los Comentarios!

Temas Relacionados: IA Programación Programación IA Ollama
Redactor del Artículo: Raúl Unzué

Raúl Unzué

Soy un apasionado de la virtualización con más de 20 años de experiencia, especializado en soluciones como VMware(premio vExpert y vExpert Pro desde 2013), Proxmox e Hyper-V. Durante mi carrera, he ayudado a empresas a optimizar sus infraestructuras TI mientras comparto mis conocimientos como redactor IT. Mi objetivo es traducir lo complejo en algo práctico y accesible, combinando teoría con experiencia real. Si te interesa la virtualización, las herramientas TI o simplemente aprender algo nuevo, espero ayudarte con mis artículos.