Nota del editor: Esta serie describe cinco de los habitantes de la región de Seattle. “Pensadores poco comunes”: inventores, científicos, tecnólogos y emprendedores que transforman industrias e impulsan cambios positivos en el mundo. serán reconocidos 12 de diciembre al Gala GeekWire. Pensadores poco comunes se presenta en asociación con Socios del Gran Seattle.
La búsqueda de Hannaneh “Hanna” Hajishirzi para abrir la caja negra de la inteligencia synthetic refleja una determinación que ha definido su búsqueda de la informática desde que tenía 10 años.
Cuando period niña, le encantaba la previsibilidad y la lógica de las matemáticas y las computadoras. ¿Química? No, gracias. Demasiadas excepciones. Pero cuando se trataba de estudiar teoría de grafos y álgebra, o programación en QBasic y Pascal, ella estaba de acuerdo.
“Criar a Hanna fue fácil y difícil”, dijo su madre, Soheila Hajishirzi. Fue fácil, explicó, porque su hija siempre fue más madura que su edad y más dispuesta a escuchar razonamientos lógicos. Pero también fue difícil, dijo su madre, “porque nunca se conformó; siempre se desafió a sí misma a aprender más”.

Hajishirzi se especializa en el procesamiento del lenguaje pure, centrándose en modelos de inteligencia synthetic de código abierto. Es directora senior de investigación de PNL en el Instituto Allen de IA (Ai2) y profesor adjunto en la Escuela de Ciencias de la Computación Paul G. Allen de la Universidad de Washington en Seattle.
Su trabajo se basa, en parte, en la creencia de que el mundo merece saber más sobre potentes modelos de IA de lo que las grandes empresas tecnológicas están dispuestas a revelar. En su puesto en Ai2, es una de las líderes del equipo detrás del modelo de lenguaje abierto OLMo y del modelo de post-entrenamiento Tulu.
La diferencia es que el instituto sin fines de lucro hace que todos los ingredientes, recetas y salsa secreta para estos modelos de IA estén disponibles públicamente, en forma de datos de entrenamiento, código de entrenamiento, pesos de modelo, puntos de management y otra información. La concept es mejorar la comprensión técnica de la IA entre los investigadores y acelerar el progreso científico en este campo en common.
“Queremos innovar, crear nuevas metodologías, nuevos avances en el modelado del lenguaje y la investigación de IA generativa, y luego incluso informar a muchos otros investigadores y empresas sobre cómo deberían ser los nuevos modelos”, dijo Hajishirzi.
Esto contrasta con los populares modelos cerrados de IA, en los que la falta de transparencia limita la capacidad de los investigadores para evaluarlos, mejorarlos y aprovecharlos.
“Creo que una gran parte de la razón por la que Hanna siente pasión por nuestro enfoque radicalmente abierto es simplemente su compromiso con la ciencia”, dijo Noé Smithtambién de Ai2 y la Escuela Allen de la Universidad de Washington, quien codirige el equipo responsable de OLMo y Tulu con Hajishirzi.
Impulsado por un espíritu competitivo
Hajishirzi y el equipo de Ai2 se enorgullecen de que sus modelos igualen o superen a sus rivales, especialmente a las alternativas cerradas, en los principales puntos de referencia de rendimiento de los modelos de IA. Este no es un logro pequeño, especialmente teniendo en cuenta que Ai2 no tiene los vastos recursos de Microsoft, Amazon o Google, o empresas relativamente nuevas como Anthropic y OpenAI.
Ai2 compensa esto centrándose en parte en mejorar la eficiencia del entrenamiento de modelos de lenguaje grandes, para reducir los recursos informáticos y los costos necesarios.
Esto también es motivo de orgullo: demostrar que es posible que un equipo inteligente y ágil se enfrente cara a cara con los gigantes tecnológicos.
Smith recordó, por ejemplo, cómo Hajishirzi pudo reunir a su equipo para concentrarse en vencer a cierto modelo de IA durante el desarrollo de Tulú 3. Esta es la iniciativa Ai2 que se centra en la post-formación, el proceso de refinar un modelo de lenguaje para mejorar sus capacidades para aplicaciones específicas. (Smith llamó “X” al modelo competidor, sin querer revelar qué modelo estaban decididos a derrocar).
“Hanna logró que el equipo se concentrara en 'vencer a X' en la medida justa, sin sacrificar nunca la integridad científica, pero también manteniéndose inspirado para asumir el desafío”, dijo Smith. “Creo que todo se scale back a escuchar atentamente y saber dónde están todos en un día en explicit, e intercalar el mantra 'beat X' en el momento justo en el que inspirará”.

Al anunciar los nuevos modelos Tulu 3 el mes pasado, Hajishirzi dijo que rivalizan y, en algunos casos, superan a los modelos propietarios de OpenAI, Mistral, Google y otros en puntos de referencia en habilidades como matemáticas, seguimiento de instrucciones y capacidades de chat.
Centrándose en los desafíos del mundo actual
El espíritu competitivo de Hajishirzi se remonta a su infancia.
“Period una niña curiosa con una profunda pasión por todo tipo de juegos, desde rompecabezas y legos hasta voleibol y balón prisionero”, dijo su madre. Desde muy pequeña, “mostró señales de ser competitiva y trabajó duro para ser la mejor en cada partido que jugó”.
A medida que creció, comenzó a mostrar rasgos de ser una líder entre sus amigos y ganarse su confianza.
“A lo largo de su carrera, ella ha demostrado constantemente una fuerte determinación de dar lo mejor de sí misma en cada etapa de su vida”, dijo su madre.
En la escuela secundaria y la universidad, la pasión de Hajishirzi por las matemáticas discretas y el código eficiente inicialmente alimentó su interés por la informática teórica. Pero entonces un concurso de robótica le abrió los ojos a un potencial mayor.
“No lo logramos, pero fue una aplicación interesante en el mundo actual”, dijo, recordando cómo fue aplicar su conocimiento de algoritmos informáticos y estructura de datos a algo tangible como el movimiento de un robotic. “Así que eso se volvió muy interesante para mí”.

Hajishirzi creció en Irán y asistió a la Universidad Tecnológica de Sharif, donde obtuvo su licenciatura en informática e ingeniería. Llegó a los EE. UU. a los 20 años y asistió a la Universidad de Illinois en Urbana-Champaign para realizar su doctorado en informática, centrándose en la IA. Es profesora de la Universidad de Washington desde 2014 e investigadora de Ai2 desde 2018.
Está casada con Ali Farhadi, quien regresó a Ai2 el año pasado como director ejecutivo de la organización. Farhadi fundó y dirigió la empresa derivada de Ai2, Xnor.ai, como director ejecutivo, y vendió la startup de IA a Apple en 2020.
Los desafíos y oportunidades que se avecinan para el equipo de PNL de Ai2 incluyen el avance de la IA en dominios científicos específicos, la mejora de sus capacidades de modelado de lenguaje y la búsqueda de direcciones novedosas en la investigación de la IA, al tiempo que se prioriza la educación, la participación de la comunidad y los principios subyacentes de transparencia y colaboración abierta.
Ver claramente a través de un desastre
¿Se considera Hajishirzi una “pensadora poco común”? Después de reflexionar inicialmente sobre esta pregunta en nuestra entrevista reciente, lo pensó un poco más y luego respondió por correo electrónico.
“Creo que la mayoría de las personas que piensan profundamente son pensadores poco comunes a su manera”, escribió. “Para mí, disfruto mucho asumiendo nuevos desafíos, especialmente aquellos que están inspirados en problemas del mundo actual. Abordarlos requiere perseverancia, lo cual creo que es clave para resolver con éxito estos desafíos”.
Conectar concepts de diferentes áreas y utilizarlas para afrontar nuevos desafíos es un enfoque que Hajishirzi ha encontrado exitoso.
Ella explicó: “Siempre creo que hay más de una manera de abordar un problema, así que si un enfoque no funciona, intentaré otro camino”.
Otro rasgo que outline su personalidad: le gusta que las cosas estén organizadas. “Incluso en mi casa, si tengo tiempo additional, simplemente voy y organizo las cosas”, explicó.
Los colegas dicen que esta mentalidad se traduce en su trabajo.
Ella es “realmente buena para observar un lío de información complicado y confuso y ver claramente qué se puede ignorar con seguridad, qué podemos concluir, qué aún necesitamos descubrir y determinar los próximos pasos viables”, dijo Smith.
“Algunas personas provocan el caos”, dijo. “Hanna pone orden”.