Página de estado de "Fin de la guardia (trilogía de Bill Hodges n. ° 3) de Stephen King". Crédito:Maity, Panigrahi y Mukherjee.
Investigadores de la Universidad Northwestern, Microsoft Research India, y el Instituto Indio de Tecnología Kharagpur han desarrollado recientemente un modelo para predecir si un libro se convertirá en un éxito de ventas en Amazon dentro de los 15 días posteriores a su publicación. Su modelo, descrito en un estudio publicado previamente en arXiv, funciona analizando el comportamiento de lectura en la plataforma online Goodreads.
"Hemos estado trabajando para analizar la dinámica de popularidad de varias entidades de redes sociales, como hashtags en Twitter, temas en Quora, etc. "Animesh Mukherjee, uno de los investigadores que llevó a cabo el estudio le dijo a TechXplore. "Sentimos que se podría adoptar un enfoque similar para analizar la popularidad de los libros y encontramos que Goodreads es ideal para esta investigación".
La popularidad de un libro depende de una multitud de factores y se puede medir utilizando varios parámetros. En su estudio, los investigadores se centraron en cómo las características de lectura de libros influyen en su popularidad. Realizaron un análisis multiplataforma de las entidades de Goodreads e intentaron vincularlas con el volumen de ventas de libros en Amazon.
"Seguimos la intuición de que la popularidad de los libros es impulsada principalmente por sus lectores, de ahí la motivación para extraer el comportamiento de lectura de libros para comprender la popularidad futura de los libros, "Dijo Mukherjee." Una de las mejores formas de cuantificar la popularidad de los libros es observar su historial de ventas. Por lo tanto, intentamos cuantificar la noción de popularidad en términos de los más vendidos de Amazon ".
Para empezar, los investigadores analizaron el comportamiento de lectura colectiva de los usuarios de Goodreads. Luego cuantificaron diferentes rasgos característicos de las entidades de Goodreads, que podría usarse para identificar diferencias entre los más vendidos de Amazon y otros libros de menor venta. Finalmente, desarrollaron un modelo basado en el aprendizaje automático que utiliza estas características para predecir si un libro se convertirá en un éxito de ventas 15 días después de su publicación.
"Utilizamos modelos de aprendizaje automático de última generación para realizar nuestras predicciones, "Mukherjee explicó." Observamos que las calificaciones y reseñas recibidas por un libro en Goodreads no son tan efectivas para predecir los más vendidos como los patrones de publicación de estado de lectura de los usuarios. Por ejemplo, en Goodreads, un lector puede publicar cuánto del libro se ha leído, en qué página se encuentra, puede comentar sobre el libro, etc. Consideramos que estas características son muy efectivas para predecir si el libro será un éxito de ventas en el futuro ".
Propiedades características de las publicaciones de estado de los usuarios de Goodreads:distribución de a) número de actualizaciones de estado por usuario b) número de usuarios únicos que actualizan el estado c) número de usuarios que actualizan varias veces d) tiempo de llegada entre estados e) extensión máxima promedio de lectura f ) tiempo promedio para terminar la lectura de ABS en comparación con otros libros. Crédito:Maity, Panigrahi y Mukherjee.
Su modelo logró una precisión promedio muy prometedora del 88,72 por ciento en la predicción de libros que se convertirían en los más vendidos de Amazon unas semanas después de su publicación. Su método, que se basó en características derivadas de publicaciones de usuarios y propiedades relacionadas con el género, logró una mejora del 16,4 por ciento en comparación con los métodos de referencia que solo utilizan factores de popularidad tradicionales, como valoraciones de libros o reseñas.
"Una de las ideas más importantes que obtenemos de este estudio es que los libros más vendidos de Amazon pueden no estar necesariamente calificados por un texto de revisión de alta calidad de los lectores o un alto volumen de calificaciones, "Dijo Mukherjee." En contraste, una gran mayoría de ellos tienen patrones de publicación de estado de lector que los distinguen fuertemente del resto de los libros ".
Los investigadores también evaluaron qué tan bien su método podría predecir dos tipos más de libros:los de alta calificación que reciben una gran cantidad de reseñas pero que no son los más vendidos (HRHR), y libros nominados al premio Goodreads Choice (GCAN) que no son bestsellers. Alcanzaron una alta precisión promedio del 87,1 por ciento para GCAN y del 86,22 por ciento para los libros HRHR.
"Creemos que este trabajo es una contribución importante a la literatura actual, ya que no solo despliega el comportamiento de lectura colectiva de una plataforma social de lectura de libros a través de un riguroso estudio de medición, sino que también establece un fuerte vínculo entre dos canales ortogonales:Goodreads y Amazon. "Dijo Mukherjee.
El modelo desarrollado por Mukherjee y sus colegas podría fomentar el desarrollo de herramientas que unan a Amazon y Goodreads a través de nuevos diseños de políticas multiplataforma. Creen que tales interacciones podrían ser una de las razones detrás de la adquisición de Goodreads por parte de Amazon en marzo de 2013. Los investigadores ahora buscan expandir su estudio analizando más a fondo los comportamientos de lectura de los usuarios.
"Hay varias direcciones que planeamos explorar en el futuro, ", Dijo Mukherjee." Una es investigar la popularidad de diferentes géneros de libros, por ejemplo, ¿Cuáles son los patrones de publicación de estado en los diferentes géneros de libros? Otro es estudiar la interdinámica del género y la demografía del lector. Por ejemplo, ¿En qué se diferencian los comportamientos de lectura de los hombres de las mujeres? ¿o en qué se diferencian en varios continentes? "
© 2018 Tech Xplore