Sei sulla pagina 1di 14

Ideas largas | Consumidor

La Ventaja de los Datos


de Tesla
25 de abril de 2019 a las 14:46 ET ET Acerca de: Tesla, Inc. (TSLA)

Trent Eady
Tecnología, fabricantes de automóviles, horizonte a largo plazo.

Sigueme en Medium

Resumen

• Si se puede hacer que la tecnología funcione, la oportunidad de


robotaxi para Tesla supera con creces su capitalización de
mercado actual.

• Para comprender la competitividad tecnológica de Tesla en el


campo de robotaxi, debemos entender la importancia de los
datos de entrenamiento para las redes neuronales.

• También debemos entender si Tesla puede convertir su ventaja


astronómica en millas de flota, en datos de entrenamiento útiles.

• El Día de la Autonomía de Tesla reveló que el equipo de AI utiliza


múltiples técnicas para evitar el cuello de botella del etiquetado
humano en los datos de entrenamiento.

• Tesla también explicó cómo puede extraer selectivamente datos


relevantes de miles de millones de millas del mundo real.
En mi artículo anterior de Seeking Alpha, escribí:

”La pregunta clave para los inversores ... es si Tesla puede realmente
aprovechar su flota de entrenamiento de aproximadamente 450,000
automóviles para producir un rendimiento de conducción autónoma
significativamente mejor que otras compañías. El recurso que
diferencia a Tesla son los datos de entrenamiento. Pero este recurso
solo decide la competencia, si el enfoque técnico ganador requiere
mucha información de entrenamiento, sin el cuello de botella del
etiquetado humano que es costoso y lento.”

Sabemos que la flota de entrenamiento de Tesla ( TSLA ) RECORRE


tantas millas todos los días como la flota de entrenamiento de WAYMO (
GOOG , GOOGL ) ha conducido en toda su existencia . La flota de
Waymo recorre millones de millas, mientras que Tesla maneja miles de
millones. La primera pregunta es si tener aproximadamente 100x a
1,000x millas más para dibujar se traduce en tener proporcionalmente
más o menos datos. La segunda pregunta es si tener más o menos
datos de forma proporcional permite a Tesla entrenar redes neuronales
para lograr un rendimiento mucho mayor en tareas relevantes para la
conducción autónoma, de modo que las capacidades autónomas de Tesla
superarán a todos los competidores.

Después del reciente Día de la Autonomía de Tesla , tenemos mucha


más información para responder estas preguntas.

Implicaciones financieras
Si la respuesta a ambas preguntas es afirmativa, si no se produce un
cambio importante en el panorama competitivo, Tesla será el primero en
resolver la autonomía total, si alguien lo hace. Un despliegue exitoso de
robotaxi, a escala y ante cualquier competidor, justificaría una valuación
a largo plazo de $ 75 mil millones a $ 250 mil millones, si se creen los
modelos analistas de Waymo. Según los informes de The Information,
Waymo actualmente está buscando inversiones externas con una
valoración de más de $ 100 mil millones.
El agresivo y optimista modelo de ARK Invest para Tesla sitúa la
capitalización de mercado de Tesla en $ 909 mil millones en 2023 y su
precio de la acción en $ 4,100, teniendo en cuenta un aumento de
capital de $ 20 mil millones. Esta valoración puede sonar extrañamente
grande, pero se sigue naturalmente de un modelo detallado que el
analista de ARK Tasha Keeney ha generado generosamente.

La mayoría de los analistas que lo diseñan estarían de acuerdo en que


una vez que la robotaxis eléctrica sustituya a la mayoría de las millas de
vehículos globales, la industria de robotaxi será enorme. Por ejemplo, un
estudio encargado por Intel ( INTC ) predice que en 2050, la robotaxis
tendrá un valor de $ 7 billones. El estudio asume que los primeros
servicios de robotaxi se lanzarán en 2030 y crecerán gradualmente
durante las próximas dos décadas. El modelo de ARK, por el contrario,
supone que el primer servicio de robotaxi se lanzará este año, y que la
mayoría de las millas serán autónomas para 2027. Por lo tanto, ARK
predice $ 7 billones en valor en 2028 . Entre los modelos, los supuestos
sobre el tiempo y la tasa de adopción pueden variar considerablemente.
Sin embargo, diferentes modelos parecen estar de acuerdo sobre el
tamaño aproximado de la oportunidad.

Entonces, si Tesla puede lanzar un servicio robotaxi, y especialmente si


es la primera compañía en hacerlo a escala, el impacto financiero será
tremendo. Hará que todos los demás debates sobre Tesla sean
discutibles. Por lo tanto, vale la pena profundizar en el tema del
aprendizaje automático e intentar pensar rigurosamente sobre este
tema.

Revisemos nuestras dos preguntas clave:

1. ¿El hecho de que Tesla tenga aproximadamente de 100 a 1,000


veces más millas que Waymo se traduce en tener datos
proporcionalmente más o más raros para entrenar redes
neuronales?

2. Si es así, ¿permite esto que las redes neuronales de Tesla logren


un rendimiento mucho mayor en tareas relevantes para la
conducción autónoma, de modo que las capacidades autónomas
de Tesla superarán a todos los competidores?
La importancia de los datos de entrenamiento.
Durante su charla en el evento del Día de la Autonomía, el Director de
IA de Tesla, Andrej Karpathy, presentó el siguiente argumento sobre la
importancia de los datos de entrenamiento:

“Ahora, los conjuntos de datos grandes y variados básicamente


hacen que estas redes funcionen muy bien. Este no es solo un
hallazgo para nosotros aquí en Tesla, es un hallazgo omnipresente
en toda la industria. Entonces, los experimentos e investigaciones
de Google, de Facebook (NASDAQ: FB ), de Baidu (NASDAQ: BIDU ),
de DeepMind de Alphabet, muestran gráficos similares donde las
redes neuronales realmente aman los datos y la escala y variedad
de amor. A medida que agrega más datos, estas redes neuronales
comienzan a funcionar mejor y obtienen precisiones más altas de
forma gratuita. Entonces, más datos solo los hacen funcionar
mejor.”

Karpathy presentó la siguiente diapositiva sobre este punto:

Hasta donde puedo discernir Karpathy está representando con precisión


los hallazgos de la comunidad de investigación más amplia de
aprendizaje automático, la escala de los datos de entrenamiento es de
importancia fundamental.

Sin embargo, para cualquier tarea dada, es empírico cuestionar si


aumentar los datos de entrenamiento en un orden de magnitud o más
hará que la tarea no se resuelva o se resuelva. En algunos casos, la
curva de rendimientos decrecientes puede ser demasiado pronunciada, y
la brecha entre los no resueltos y los resueltos es demasiado amplia.

En otros casos, como las redes neuronales de OpenAI que juegan


videojuegos competitivos y generan artículos de noticias , la ampliación
de los datos de entrenamiento junto con el tamaño de las redes
neuronales ha producido resultados sorprendentemente buenos. La
filosofía del Científico Jefe de OpenAI, Ilya Sutskever , es que la escala
de datos de entrenamiento (o cómputo, que en ciertas tareas como los
videojuegos se pueden usar para generar datos de entrenamiento),
dadas las técnicas que pueden aprovecharlos, es una decisión decisiva y
hasta ahora poco apreciada. Elemento en el éxito de la IA.

Sutskever expresa su opinión de la siguiente manera:

“Este es realmente un tema muy común en el aprendizaje profundo,


donde muchos descubrimientos y avances no consisten en nuevos
algoritmos. En cambio, consisten en darse cuenta de que los
algoritmos antiguos eran más poderosos de lo que pensábamos. Y
lo mismo es el caso aquí [con OpenAI Five] . Antes de nuestros
resultados, casi todos los expertos en aprendizaje por refuerzo
creían que el aprendizaje por refuerzo en realidad no es una
tecnología tan buena. Que no puede resolver problemas difíciles. ...
Demostramos que la misma historia que hemos visto con el
aprendizaje supervisado también se lleva a cabo con el aprendizaje
por refuerzo. Ya sabemos que con el aprendizaje supervisado, si
desea resolver algún problema, probablemente pueda hacerlo si
recopila un conjunto de datos etiquetado lo suficientemente
grande. Y es por eso que hoy vemos todas las aplicaciones
comerciales de la IA: porque el aprendizaje supervisado funciona
muy bien. Pero lo que hemos demostrado es que lo mismo es válido
para el aprendizaje por refuerzo. Si hay un problema que quiere
resolver realmente mal, incluso si este es muy difícil, el aprendizaje
por refuerzo puede tener éxito si le da suficiente experiencia.”

Entonces, en opinión de Sutskever, los datos importan mucho.

Otro ejemplo reciente que puede mostrar el punto de Sutskever es el


AlphaStar de DeepMind , un sistema de red neuronal que juega al
videojuego StarCraft. Al igual que las redes neuronales de OpenAI que
juegan al juego Dota, AlphaStar se entrenó con el aprendizaje por
refuerzo (en esencia, prueba y error durante miles de años de
experiencia). Pero primero se entrenó con aprendizaje de imitación, una
técnica en la que una red neuronal observa muchos ejemplos de
comportamiento humano y aprende las correlaciones entre el estado del
medio ambiente y el comportamiento de los humanos. Para sorpresa de
los investigadores del aprendizaje de máquinas dentro y fuera de
DeepMind, la versión de AlphaStar entrenada solo con aprendizaje de
imitación logró un desempeño a nivel humano en el juego.

DeepMind acredita este resultado, al menos en gran parte, a una nueva


arquitectura de red neuronal. Sin embargo, que yo sepa, AlphaStar
también es la primera instancia en la que se ha intentado el aprendizaje
por imitación con cualquier arquitectura en la escala de millones de
juegos jugados por humanos. El artículo de DeepMind sobre AlphaStar
está por llegar; Podemos aprender más cuando se publique.

Aprendizaje imitacion
Este resultado es particularmente relevante para Tesla porque en el Día
de la autonomía, Andrej Karpathy confirmó que Tesla está utilizando el
aprendizaje por imitación. (Este es un tema sobre el que previamente he
escrito mucho ). Cuando un humano está manejando un Tesla y el piloto
automático está apagado, a veces recopila datos que se usan para
entrenar una red neuronal para emular el comportamiento del conductor
humano. Aquí es cómo Karpathy describió el proceso:

“Mientras conduce el automóvil, lo que realmente está haciendo es


anotar los datos porque está manejando el conductor. Nos estás
diciendo cómo atravesar diferentes ambientes. ... Así que
obtenemos mucho de esto de la flota, entrenamos una red neuronal
en esas trayectorias, y luego la red neuronal predice rutas solo a
partir de esos datos. Entonces, realmente a lo que se hace
referencia típicamente se le llama aprendizaje por imitación.
Estamos tomando trayectorias humanas del mundo real y solo
estamos tratando de imitar cómo las personas conducen en
mundos reales. ... Por lo tanto, la predicción del camino en realidad
está en la flota hoy, por cierto. Entonces, si estás conduciendo trébol
- si estás en una hoja de trébol en la carretera - hasta hace unos
cinco meses o así tu coche no podría hacer trébol. Ahora puede. Esa
es la predicción del camino, correr en vivo en sus coches. Enviamos
esto hace un tiempo. Y hoy vas a experimentar esto para atravesar
intersecciones. Un gran componente de cómo atravesamos las
intersecciones en sus unidades de hoy se deriva de la predicción de
la ruta de las etiquetas automáticas.”

En el siguiente video de demostración, puede ver el sistema de


predicción de trayectoria de Tesla en funcionamiento cuando el vehículo
atraviesa de forma autónoma una serie de intersecciones:
https://www.youtube.com/watch?v=tlThdr3O5Qo

Karpathy no es el único defensor del aprendizaje por imitación. Otro es


Drago Anguelov, jefe de investigación de Waymo. El dice :
“Aprender de la demostración es clave. Puede codificar algunos
modelos simples a mano, pero en última instancia, la tarea de
modelar el comportamiento del agente es compleja y se aprende
mucho mejor.”

Jeff Schneider, profesor de robótica y ex jefe de ingeniería en Uber ATG (


UBER) sostiene un punto similar :

“Creo que vamos a necesitar volver al aprendizaje por refuerzo, el


aprendizaje por imitación, este tipo de enfoques, si realmente
queremos que estos autos vayan a escala, tengan un buen
desempeño y no necesiten un ejército de ingenieros más grande
que el tamaño de la flota de carros que tienes para hacerlos
funcionar.”

Como Karpathy, Anguelov y Schneider dicen en sus respectivas charlas,


una de las partes diabólicamente difíciles de los autos que conducen por
sí mismos es la larga cola de eventos raros y extraños que ocurren en el
mundo real. Ahí es donde Tesla tiene una clara ventaja en el tamaño de
su flota de entrenamiento.

La diferencia entre una flota que recorre millones de millas al año y otra
que recorre miles de millones de millas al año no es solo la diferencia
entre los datos y más datos. También es la diferencia entre no datos y
datos. Algunos fenómenos de larga cola no ocurrirán para una flota de
entrenamiento de unos pocos cientos de autos. Una flota de
entrenamiento de cientos de miles o millones de autos se encontrará
con muchas categorías de eventos, objetos, condiciones de la carretera,
interacción entre los usuarios de la carretera, etc. que una flota de
cientos nunca verá. Sin datos, un enfoque de aprendizaje automático es
imposible. Con los datos, es posible. Con más datos, es más efectivo.

Predicción
El aprendizaje por imitación para la predicción de la trayectoria (también
llamada planificación de la trayectoria) es un área donde la flota de Tesla
presenta una ventaja. Otra área es predecir el comportamiento de otros
usuarios de la carretera.
En el Día de la Autonomía, Karpathy describió cómo cada automóvil de
Hardware 2 de la flota de Tesla, usa una red neuronal para predecir si un
vehículo de adelante va a entrar en su carril, dado que la visión de la red
neuronal puede detectar cuándo un automóvil se introduce en el carril, y
puede etiquetar automáticamente los ejemplos en los que esto ocurre.
Estos ejemplos pueden utilizarse para entrenar una red neuronal para
predecirlos antes de que ocurran. Este ejemplo ilustra cómo Tesla puede
aprovechar los datos de su flota sin estar limitado por el costo del
etiquetado humano. En palabras de Karpathy:

“Realmente, para utilizar el poder de la flota, no se desea pasar por


este cuello de botella del etiquetado humano. Se desea
simplemente transmitir en datos y [etiquetar] automáticamente.”

Percepción de profundidad
Tesla también está aprovechando los datos de la flota para la percepción
de la profundidad basada en cámara. Karpathy explicó dos técnicas que
no requieren ningún etiquetado humano: el aprendizaje supervisado por
radar y el aprendizaje auto supervisado. (Antes del Día de la autonomía,
en realidad especulé que Tesla podría estar usando un aprendizaje auto-
supervisado).

Andrej Karpathy: cómo Tesla entrena las redes neuronales para percibir la
profundidad (https://www.youtube.com/watch?v=LR0bDLCElKg)
Detección de objetos
La detección de objetos es un área en la que Tesla (como otras
compañías) usa un costoso etiquetado humano, pero aún aprovecha los
datos de la flota. Al diseñar activadores de carga basados en el
aprendizaje automático, Tesla puede recopilar instantáneas de objetos
raros.

Podrías darte cuenta de que hay un problema de huevo y gallina aquí.


¿Cómo puede Tesla detectar el objeto para cargar una instantánea de
él? La solución es que la precisión y la confianza necesaria para activar
una carga es mucho menor que la necesaria para la detección de objetos
críticos para la seguridad en tiempo real.

Si Tesla quiere activar el motor de datos (en el lenguaje de Karpathy)


para producir imágenes de ciervos, primero solo necesita unas pocas
imágenes etiquetadas de ciervos. Entonces, cada vez que una red
neuronal en un Tesla ve algo que piensa que, incluso con poca
probabilidad, podría ser un ciervo, puede cargar una instantánea, que
será revisada por etiquetadores humanos. Con el tiempo, Tesla obtendrá
más imágenes de ciervos. Se pueden etiquetar y mejorar la detección de
ciervos, aumentando la capacidad de la flota para cargar imágenes de
ciervos.
En palabras de Elon Musk, “es una compresión masiva de datos del
mundo real”. Tesla puede usar disparadores basados en aprendizaje
automático para filtrar miles de millones de millas de datos y extraer
solo lo que considere relevante.

Conclusión: la ventaja de los datos de Tesla


En mi primer artículo de Seeking Alpha, publicado en marzo de 2017 ,
argumenté que los datos generados por la flota de vehículos de
producción de Tesla proporcionaron una fuerte ventaja competitiva en el
aprendizaje automático para la conducción autónoma. En retrospectiva,
esa tesis, tal como se presentó en el artículo, era demasiado alta para
saber si es cierta. Para saber si los datos proporcionan una ventaja,
necesitamos saber:

1. Cómo se recoge.

2. Si está etiquetado (de forma automática o manual), y cómo está


etiquetado.

3. Cómo se usa para entrenar redes neuronales. (Por ejemplo, cómo


el video sin etiqueta proporciona una señal de entrenamiento para
el aprendizaje auto-supervisado).

4. El impacto de los datos de entrenamiento en el rendimiento de la


red neuronal.

Hoy, podemos responder a las preguntas 1-3 con claridad y profundidad


con respecto a la flota de Tesla. Evaluar el impacto en el rendimiento de
la red neuronal es más difícil. Tesla no da actualizaciones públicas sobre
sus métricas de rendimiento. Lo que podemos ver en cambio es la
mejora cualitativa del piloto automático y la capacidad de auto
conducción total. Lo que podríamos predecir a partir del uso a gran
escala de Tesla del aprendizaje por imitación, el aprendizaje de la
predicción con etiquetado automático y su motor de datos para la
detección de objetos es que:

1) tendrá un desempeño al menos incremental en categorías


comunes de situaciones, comportamientos y objetos, y
2) superará con creces a todos los competidores en cuanto al
rendimiento con respecto a las categorías de situaciones,
comportamientos y objetos raros y de cola larga.

El enfoque a pequeña escala y geomercado de Waymo, Cruise ( GM ),


Uber ATG, Zoox y otros podría ser fundamentalmente inviable. De
hecho, el enfoque que Waymo estaba tomando antes de 2012 era
inviable. En 2012, Alex Krizhevsky, Ilya Sutskever y Geoffrey Hinton
publicaron un artículo que catalizó la popularización del aprendizaje
supervisado profundo. Antes de 2012, el software de visión por
computador de Waymo debe haberse basado en un aprendizaje
supervisado superficial o en heurísticas hechas a mano. Lo que sea que
estuviera usando, dice Waymo su software fue solo aproximadamente
un 1% tan preciso en la detección de peatones como la primera red
neuronal profunda que utilizó. La visión por computadora de los autos
que conducen por cuenta propia es un problema bastante difícil con
redes neuronales profundas. Con un software que es 100 veces peor,
parece un problema fundamentalmente intratable.

Fue por suerte que llegó el aprendizaje profundo. Si no lo hubiera hecho,


Google podría haber abandonado su proyecto de auto-conducción para
este momento.

Un argumento que escuché es que Waymo no necesita escalar sus datos


de entrenamiento porque, en cambio, puede enfocarse en avances
fundamentales en el aprendizaje automático. Esto me parece mal por
dos razones. Primero: para mí, esto no parece ser una cuestión de
ajustar un poco la arquitectura de una red neuronal hasta que resuelva
la conducción autónoma. La solicitud de Waymo es diseñar un sistema
de generación de máquinas que pueda aprender de menos ejemplos o
mejorar radicalmente su capacidad de generalizar más allá de los
ejemplos en los que se ha entrenado. Esto sería un avance tan grande o
más grande que el aprendizaje profundo. Me parece como planear un
milagro.

Segundo: si este avance se produjo fuera de Alphabet, como en el


mundo académico, en OpenAI , o incluso en una compañía que quería
compartir abiertamente su investigación, Tesla también podría usarla.
Esta nueva técnica presumiblemente funcionaría incluso mejor con una
fuente de datos de entrenamiento de 100x a 1,000x, o al menos no
peor. No es suficiente que ocurra un milagro. Tienes que ser el que lo
realice. Además, una vez que lo realiza, los demás no deben poder
replicarlo.

Para mí, la evidencia más convincente de que el enfoque de Tesla


funcionará es AlphaStar. Como describí anteriormente, una versión de
AlphaStar logró una habilidad a nivel humano en StarCraft, un juego de
estrategia complejo y difícil en tiempo real, que utiliza solo aprendizaje
por imitación. StarCraft parece aproximadamente tan difícil como
conducir, y la flota de Tesla parece capaz de facilitar el aprendizaje por
imitación en aproximadamente la misma escala que StarCraft. Hay
precedentes de lo que Tesla quiere lograr.

Siempre es posible que la realidad salga diferente. Es incierto cómo se


desarrollará el futuro. Solo estoy tomando algunos principios generales y
algunos resultados notables en el aprendizaje automático y la
extrapolación al esfuerzo de Tota de robotaxi. Personalmente, encuentro
esta extrapolación lo suficientemente convincente, y mi tolerancia al
riesgo es lo suficientemente alta, de que estoy dispuesto a hacer una
apuesta monetaria ante la posibilidad de que el esfuerzo de robotaxi sea
un éxito.

Una nota de agradecimiento:

En mi artículo anterior, le hice cinco preguntas a Tesla. En el Día de la


Autonomía, Tesla las contestó todas. Quiero agradecer a Tesla por ser
tan cercana con los detalles técnicos. Ustedes vinieron a través Gracias,
Elon, y especialmente gracias, Andrej.

También quiero agradecer a Tasha Keeney en ARK Invest por la fuente


abierta de su modelo de taxi autónomo y por hacer la pregunta más
importante en el Día de la autonomía. Gracias a la pregunta de Tasha,
aprendimos que la aspiración a largo plazo de Tesla es hacer un
aprendizaje de extremo a extremo con su aún misteriosa computadora
Dojo. Gracias, Tasha.
Gracias también a todos los expertos y entusiastas de aprendizaje
automático y de vehículos autónomos que respondieron mis preguntas y
me brindaron sus comentarios. Si eres un experto o entusiasta en una
de estas áreas y tienes comentarios sobre este artículo, contáctame a
través de este formulario o contribuye a la discusión en el foro que creé.

https://seekingalpha.com/article/4256796-teslas-data-advantage

Divulgación: Yo soy / somos largos TSLA. Escribí este artículo yo mismo, y expresa mis propias
opiniones. No estoy recibiendo compensación por ello (excepto por parte de Seeking Alpha). No
tengo ninguna relación comercial con ninguna compañía cuyas acciones se mencionan en este
artículo.

Divulgación adicional: Descargo de responsabilidad: Este artículo no es un consejo de


inversión. Invierta bajo su propio riesgo.

Potrebbero piacerti anche