A comienzos de este año, GitHub presentó Copilot Chat, un chatbot especializado en programación que se asemeja a ChatGPT, dirigido a organizaciones que usan Copilot for Business. Copilot Chat recientemente se introdujo para los usuarios individuales de Copilot, aquellos que abonan una tarifa de $10 mensuales, en su versión beta. Y ahora, GitHub ha liberado Chat para que esté disponible para todos los usuarios.
Desde hoy, Copilot Chat se puede encontrar en el panel lateral de los entornos de desarrollo de Microsoft, como Visual Studio Code y Visual Studio, ofreciéndose como parte de los paquetes pagos de GitHub Copilot o de forma gratuita para profesores verificados, estudiantes y administradores de determinados proyectos de código abierto.
«Siendo el epicentro de la comunidad de desarrolladores global, hemos introducido al mercado la herramienta de desarrollo AI más popular hasta la fecha. Y nuestro producto inicial fue solo el punto de partida», mencionó Shuyin Zhao, VP de gestión de productos en GitHub.
No se han introducido muchos cambios en Copilot Chat desde su fase beta.
El chatbot continúa utilizando GPT-4, el destacado modelo de inteligencia artificial generativa de OpenAI, diseñado específicamente para situaciones de desarrollo. Los programadores pueden consultar a Copilot Chat de forma natural para obtener asistencia en tiempo real, como pedir explicaciones de conceptos, identificar posibles fallos de seguridad o redactar pruebas unitarias.
Al igual que otros modelos de inteligencia artificial generativa, el núcleo de Copilot Chat, GPT-4, se entrenó con información de acceso público, incluyendo material protegido por derechos de autor o bajo licencias restringidas. Empresas como GitHub argumentan que están amparadas por la doctrina de uso legítimo frente a posibles litigios por infracciones de derechos de autor. Sin embargo, esto no ha impedido que algunos desarrolladores presenten demandas conjuntas contra GitHub, Microsoft (compañía matriz de GiHub) y OpenAI, alegando infracciones en licencias de código abierto y propiedad intelectual.
Cuando le consulté a Zhao si los dueños de proyectos tendrían la opción de excluirse del proceso de entrenamiento, ella indicó que no hay un método específico para hacerlo con el lanzamiento más amplio de Copilot Chat, pero sugirió que aquellos con bases de código sensibles deberían hacer sus repositorios privados para evitar ser incluidos en futuros sets de entrenamiento.
Resulta difícil pensar que los dueños de las bases de código verán con buenos ojos esa propuesta; hay diversas razones para mantener públicos los fragmentos de código con derechos de autor, siendo una de las principales la colaboración colectiva para identificar fallos. Sin embargo, GitHub parece decidido a no permitir excepciones en cuanto a la exclusión de datos de entrenamiento, al menos por ahora.
Los sistemas de inteligencia artificial generativa, como GPT-4, a menudo tienden a producir información errónea o a inventar datos con seguridad, lo que representa un problema serio en el dominio de la programación. Un estudio reciente realizado en Stanford señaló que los programadores que emplean asistentes de IA para codificar suelen generar código con mayores vulnerabilidades en comparación con aquellos que prescinden de tales herramientas, en gran medida debido a que los asistentes de IA incorporan segmentos de código con errores o desactualizados.
Zhao indicó que GPT-4 demuestra un desempeño «superior» al enfrentarse a tales errores en comparación con la versión anterior que alimentaba a Copilot. Además, resaltó funcionalidades diseñadas para prevenir riesgos, como filtros que identifican patrones de código inseguro, alertando a los usuarios de Copilot Chat sobre posibles amenazas como claves codificadas, inyecciones SQL o desvíos de rutas. No obstante, hizo hincapié en la necesidad de una revisión meticulosa del código sugerido por la IA por parte de humanos.
«GitHub Copilot se basa en los modelos de OpenAI, que consideramos los más adecuados para las soluciones que ofrecemos en la actualidad. Estamos bien posicionados para seguir proporcionando herramientas de IA a los desarrolladores, permitiéndoles construir software más avanzado y seguro, mientras disfrutan del proceso», comentó Zhao.
En octubre, el líder de Microsoft, Satya Nadella, informó a los expertos que Copilot contaba con un millón de usuarios abonados y cerca de 37,000 empresas asociadas. Sin embargo, GitHub tiene el desafío de hacer que Copilot sea aún más competitivo para evitar perder terreno frente a rivales y, por consiguiente, ver reducidos sus ingresos.
De acuerdo con un artículo del Wall Street Journal, Copilot genera pérdidas que ascienden a unos $20 mensuales por cada usuario, con algunos suscriptores costándole a GitHub hasta $80 al mes. Se sugiere que el costo elevado asociado a mantener en funcionamiento los modelos de IA es la causa principal, un obstáculo que también enfrentó la startup de codificación GenAI, llevándola a cerrar a finales del año pasado.
Mientras GitHub busca rentabilizar Copilot, Amazon sigue mejorando CodeWhisperer, tal vez el competidor más fuerte de Copilot en términos de recursos.
En abril, Amazon decidió ofrecer CodeWhisperer sin costo alguno para los desarrolladores sin restricciones en cuanto al uso. Ese mismo mes, presentaron el nivel profesional de CodeWhisperer, que incorporó autenticación única con integración de Gestión de Identidad y Acceso de AWS, además de ampliar los límites en la detección de brechas de seguridad. Una opción empresarial para CodeWhisperer se puso en marcha en septiembre. Y a comienzos de noviembre, Amazon anunció una versión «optimizada» de CodeWhisperer, ofreciendo recomendaciones «mejoradas» para el desarrollo de aplicaciones en MongoDB, la solución de gestión de bases de datos de código abierto.
Aparte de CodeWhisperer, Copilot enfrenta competencia de startups como Magic, Tabnine, Codegen y Laredo, así como de modelos de código abierto como Code Llama de Meta y StarCoder de Hugging Face y ServiceNow.