Follow by Email

Follow by Email

Search This Blog

Friday, 12 June 2015

Aprendizaje de máquina en línea





El aprendizaje de máquina en línea se utiliza en el caso donde los datos se convierten en disponible en una forma secuencial, con el fin de determinar un mapeo del conjunto de datos a las etiquetas correspondientes. La diferencia clave entre el aprendizaje en línea y por lotes de aprendizaje (o de aprendizaje "fuera de línea") técnicas, es que en el aprendizaje en línea el mapeo se actualiza después de la llegada de cada nuevo punto de datos de una manera escalable, mientras que las técnicas de proceso por lotes se utiliza cuando se tiene acceso a la toda formación de datos a la vez. El aprendizaje en línea se podría utilizar en el caso de un proceso que ocurre en el tiempo, por ejemplo, el valor de una acción dada su historia y otros factores externos, en cuyo caso los cambios de asignación conforme pasa el tiempo y tenemos más y más muestras.
Idealmente en el aprendizaje en línea, la memoria necesaria para almacenar la función permanece constante incluso con puntos de datos adicionales, ya que la solución calculada en un paso se actualiza cuando un nuevo punto de datos esté disponible, después de lo cual que punto de datos puede entonces ser desechada. Para muchas formulaciones, por ejemplo, los métodos kernel no lineales, cierto aprendizaje en línea no es posible, a través de una forma de aprendizaje en línea híbrida con algoritmos recursivos se puede utilizar. En este caso, los requisitos de espacio ya no se garantiza que sea constante ya que requiere el almacenamiento de todos los puntos de datos anteriores, pero la solución puede tardar menos tiempo para calcular con la adición de un nuevo punto de datos, en comparación con las técnicas de aprendizaje por lotes.
Como en todos los problemas de aprendizaje automático, el objetivo del algoritmo es minimizar algunos criterios de rendimiento utilizando una función de pérdida. Por ejemplo, con la predicción del mercado de valores del algoritmo puede intentar minimizar el cuadrado medio errorbetween el valor predicho y verdadero de una acción. Otro criterio de rendimiento popular es la de minimizar el número de errores cuando se trata con problemas de clasificación. Además de las aplicaciones de carácter secuencial, los algoritmos de aprendizaje en línea también son relevantes en aplicaciones con grandes cantidades de datos tales que los enfoques tradicionales de aprendizaje que utilizan los establecidos en el agregado de datos enteros son computacionalmente imposible.
ver más: https://en.wikipedia.org/wiki/Online_machine_learning