Identifique cuáles de sus proyectos requieren de una Transformación Digital
3 junio, 2019
Un juego de arrastrar y soltar
13 junio, 2019

Científico de datos (Data Scientist): el trabajo más sexy del siglo XXI



Cuando Jonathan Goldman llegó a trabajar en junio de 2006 en LinkedIn, el lugar aún se sentía como una empresa nueva. La compañía tenía poco menos de 8 millones de cuentas y el número estaba creciendo rápidamente a medida que los miembros existentes invitaban a sus amigos y colegas a unirse. Pero los usuarios no estaban buscando conexiones con las personas que ya estaban en el sitio a la velocidad que los ejecutivos esperaban. Al parecer faltaba algo en la experiencia social. Como lo dijo un gerente de LinkedIn, "Fue como llegar a una recepción de una conferencia y darse cuenta de que no conoces a nadie. Así que solo te quedas en la esquina bebiendo tu bebida, y probablemente te vayas temprano”.

Goldman, con un doctorado en física de Stanford, estaba intrigado por la vinculación que vió y por la riqueza de los perfiles de usuario. Parecía tener datos confusos y análisis difíciles de manejar, pero cuando comenzó a explorar las conexiones de las personas, comenzó a ver posibilidades. Comenzó a formar teorías, probando corazonadas y encontrando patrones que le permitían predecir en qué redes aterrizaría un perfil determinado. Podría imaginar que las nuevas características que aprovechan las heurísticas que estaba desarrollando podrían proporcionar valor a los usuarios. Pero el equipo de ingeniería de LinkedIn, atrapado en los desafíos de ampliar el sitio, no parecía estar interesado. Algunos colegas rechazaban abiertamente las ideas de Goldman. ¿Por qué los usuarios necesitarían LinkedIn para descubrir sus redes? El sitio ya tenía un importador de libreta de direcciones que podía atraer todas las conexiones de un miembro.

Afortunadamente, Reid Hoffman, el cofundador y CEO de LinkedIn en ese momento (ahora su presidente ejecutivo), tenía fe en el poder de los analíticos debido a sus experiencias en PayPal, y le había otorgado a Goldman un alto grado de autonomía. Por un lado, le había dado a Goldman una manera de sortear el ciclo tradicional de lanzamiento de productos mediante la publicación de pequeños módulos en forma de anuncios en las páginas más populares del sitio.

A través de uno de estos módulos, Goldman comenzó a probar qué sucedería si le presentara a los usuarios los nombres de personas con las que aún no se habían conectado pero que probablemente tenían relación, por ejemplo, personas que habían compartido sus universidades y lugares de trabajo. Lo hizo mediante la creación de un anuncio personalizado que mostraba las tres mejores coincidencias para cada usuario en función de lo ingresado en su perfil de LinkedIn. A los pocos días era obvio que algo extraordinario estaba ocurriendo. La tasa de clics en esos anuncios fue la más alta jamás vista. Goldman continuó refinando la forma en que se generaron las sugerencias, incorporando ideas de redes como el "cierre triangular", la noción de que si conoces a Larry y Sue, es muy probable que Larry y Sue se conozcan entre sí.

La escasez de científicos de datos se está convirtiendo en una seria limitación en algunos sectores.

Los altos directivos de LinkedIn no tardaron mucho en reconocer una buena idea y convertirla en una característica estándar. Ahí es cuando las cosas realmente despegaron. Los anuncios de "personas que quizás conozcas" alcanzaron un porcentaje de clics un 30% más alto que el que obtuvieron otras indicaciones para visitar más páginas del sitio. Generaron millones de nuevas visitas a la página. Gracias a esta característica, la trayectoria de crecimiento de LinkedIn cambió significativamente.

Una nueva raza

Goldman es un buen ejemplo de un nuevo jugador clave en las organizaciones: el "científico de datos". Es un profesional de alto rango con la capacitación y la curiosidad para hacer descubrimientos en el mundo del big data. El título ha existido por solo unos pocos años. (Fue acuñado en 2008 por uno de nosotros, DJ Patil y Jeff Hammerbacher, y luego los líderes respectivos de los esfuerzos de análisis y datos en LinkedIn y Facebook). Pero miles de científicos de datos ya están trabajando en empresas nuevas. Su aparición repentina en la escena empresarial refleja el hecho de que las empresas ahora están luchando con información que viene en variedades y volúmenes nunca antes encontrados. Si su organización almacena múltiples petabytes de datos, si la información más importante para su empresa reside en formas distintas a las filas y columnas de números, o si la respuesta a su pregunta más importante implicaría un "mashup" de varios esfuerzos analíticos, entonces usted tiene una oportunidad de big data.

Gran parte del entusiasmo actual por el big data se centra en las tecnologías que lo hacen posible, incluyendo Hadoop (el marco más utilizado para el procesamiento de sistemas de archivos distribuidos) y herramientas de código abierto relacionadas, computación en la nube y visualización de datos. Si bien esos son avances importantes, al menos tan importantes son las personas con el conjunto de habilidades (y la mentalidad) para darles un buen uso. En este frente, la demanda se ha adelantado a la oferta. De hecho, la escasez de científicos de datos se está convirtiendo en una seria limitación en algunos sectores. Greylock Partners, una empresa de riesgo incipiente que ha respaldado compañías como Facebook, LinkedIn, Palo Alto Networks y Workday, está lo suficientemente preocupada por la escasez de mano de obra que ha creado su propio equipo de reclutamiento especializado para canalizar talento a las empresas en su portafolio. "Una vez que tienen datos", dice Dan Portillo, quien lidera ese equipo, "realmente necesitan personas que puedan manejarlo y encontrar información sobre él".

¿Quiénes son esas personas?

Si la capitalización de Big Data depende de la contratación de estos escasos recursos, el desafío para los gerentes es aprender cómo identificar ese talento, atraerlo a una empresa y hacerlo productivo. Ninguna de esas tareas es tan sencilla como lo es con otras funciones organizativas establecidas. Comience con el hecho de que no hay programas universitarios que ofrezcan títulos en ciencia de datos. También hay poco consenso sobre dónde encaja el rol en una organización, cómo los científicos de datos pueden agregar el mayor valor y cómo se debe medir su desempeño.

Más que nada, lo que hacen los científicos de datos es hacer descubrimientos al nadar en datos. Es su método preferido para navegar por el mundo que los rodea. A gusto en el ámbito digital, pueden estructurar grandes cantidades de datos sin forma y posibilitar el análisis. Identifican fuentes de datos ricas, las unen con otras fuentes de datos potencialmente incompletas y limpian el conjunto resultante.

En un entorno competitivo donde los desafíos cambian y los datos nunca dejan de fluir, los científicos de datos ayudan a los tomadores de decisiones a pasar del análisis ad hoc a una conversación continua con datos. Los científicos de datos se dan cuenta de que enfrentan limitaciones técnicas, pero no permiten que eso atasque su búsqueda de soluciones novedosas. A medida que hacen descubrimientos, comunican lo que han aprendido y sugieren sus implicaciones para nuevas direcciones de negocios. A menudo, son creativos para mostrar información visualmente y hacer que los patrones que ellos encuentran sean claros y atractivos. Asesoran a los ejecutivos y gerentes de productos sobre las implicaciones de los datos para los productos, procesos y decisiones. Dado el estado incipiente de su oficio, a menudo los científicos de datos deben diseñar sus propias herramientas e incluso realizar investigaciones de estilo académico. Yahoo, una de las empresas que empleó a un grupo de científicos de datos desde el principio, fue fundamental en el desarrollo de Hadoop. El equipo de datos de Facebook creó el lenguaje Hive para la programación de proyectos Hadoop. Muchos otros científicos de datos, especialmente en compañías basadas en datos como Google, Amazon, Microsoft, Walmart, eBay, LinkedIn y Twitter, han agregado y refinado el conjunto de herramientas.

¿Qué clase de persona hace todo esto? ¿Qué habilidades hacen que un científico de datos tenga éxito? Piense en él o ella como un híbrido de hacker de datos, analista, comunicador y asesor de confianza. La combinación es extremadamente poderosa y rara.