banner
Centro de Noticias
Excelentes insumos, riguroso aseguramiento de la calidad.

Datasaur te permite construir un modelo automáticamente a partir de un conjunto de etiquetas

Jun 04, 2023

Mucho antes de que la gente hablara de ChatGPT y la IA generativa, empresas como Datasaur se ocupaban de los aspectos prácticos de la construcción de modelos de aprendizaje automático, ayudando a etiquetar cosas para entrenar el modelo. A medida que la IA ha despegado, este tipo de capacidad se ha vuelto aún más importante.

Para llevar la creación de modelos a más empresas sin un especialista en ciencia de datos, Datasaur anunció la capacidad de crear un modelo directamente a partir de los datos de la etiqueta, poniendo la creación de modelos al alcance de una audiencia mucho menos técnica. También anunció una extensión inicial de $4 millones que se cerró en diciembre pasado.

El fundador de la empresa, Ivan Lee, dice que el reciente aumento en el interés por la IA ha sido excelente para la empresa y, de hecho, influye bien en la estrategia de la startup. "Lo que Datasaur siempre se ha esforzado por ser es el mejor lugar para recopilar los datos de entrenamiento que necesita para alimentar sus modelos, ya sean LLM o modelos NER tradicionales, análisis de sentimiento o lo que sea", dijo Lee a TechCrunch.

"Somos simplemente la mejor interfaz para que estos usuarios no técnicos entren y etiqueten esos datos", dijo.

El auge de los LLM está ayudando a crear conciencia en general sobre cómo la IA puede ayudar en un contexto empresarial, pero dice que la mayoría de las empresas todavía se encuentran en la etapa exploratoria y todavía necesitan productos como Datasaur para construir modelos. Lee dice que uno de sus objetivos desde el principio ha sido democratizar la IA, particularmente en torno al procesamiento del lenguaje natural, y la nueva característica de construcción de modelos debería poner la IA al alcance de más empresas, incluso aquellas sin experiencia especializada.

"Y esta característica es una que me entusiasma particularmente porque permite a los equipos sin científicos de datos, sin ingenieros, simplemente marcar y etiquetar estos datos como mejor les parezca, y automáticamente entrenará un modelo para ellos", dijo Lee. .

Lee ve esto como una forma de ir más allá del mercado objetivo inicial de los científicos de datos. "Ahora vamos a abrirlo para que las empresas de construcción, bufetes de abogados y empresas de marketing, que tal vez no tengan experiencia en ingeniería de datos, pero aún puedan construir modelos de PNL [basados ​​en sus datos de capacitación]".

Dice que ha podido limitar la cantidad de inversión de riesgo que ha realizado (la semilla anterior fue de unos modestos 3,9 millones de dólares en 2020) porque opera de manera eficiente. Su equipo de ingeniería se encuentra principalmente en Indonesia y, si bien espera contratar, se enorgullece de operar la empresa de manera eficiente.

"Mi filosofía siempre ha sido la rentabilidad, crecer de manera escalable, nunca crecer a toda costa", dijo Lee. Eso significa que considera cada contratación y el impacto que tendrá en el negocio.

Al tener una fuerza laboral remota e intercultural, los empleados pueden aprender unos de otros y eso aporta diversidad a la empresa por su naturaleza. “Existe una diferencia significativa en la cultura laboral entre Estados Unidos y cómo funcionan las cosas en Indonesia. Y una cosa es que hemos tenido que ser intencionales para capturar lo mejor de ambos mundos”, dijo. Eso podría significar alentar a los colegas indonesios a hablar o rechazar lo que dice un gerente, algo que culturalmente detestan hacer. "Hemos sido muy proactivos para fomentar eso", dijo.

Pero dice que hay muchas cosas que los empleados estadounidenses también pueden aprender sobre cómo funcionan las cosas en Asia, como el respeto por sus colegas y esta cultura de poner al equipo en primer lugar, y ha tenido que ayudar a los equipos a navegar estas diferencias culturales.

La inversión de 4 millones de dólares fue liderada por Initialized Capital con la participación de HNVR, Gold House Ventures y TenOneTen. La empresa ha recaudado un total de 7,9 millones de dólares.