• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  • El científico investigador de inteligencia artificial de Google anuncia la búsqueda de conjuntos de datos

    Crédito:CC0 Public Domain

    Google, desde el primer día, se hizo grande al entrar en el negocio de encontrar información. Años después, Google está hablando de negocios serios sobre conjuntos de datos. Google está lanzando un nuevo motor de búsqueda para ayudar a los científicos a encontrar los conjuntos de datos que necesitan.

    El miércoles, La científica investigadora de IA de Google, Natasha Noy, anunció el lanzamiento de Google Dataset Search. Ahora tiene fácil acceso a conjuntos de datos, si eres cientifico, o simplemente datos "geek" en otro tipo de búsqueda, buscando datos para tu trabajo y para tus historias y para tu curiosidad intelectual.

    El objetivo es brindarle más de una interfaz única. Jon Fingas en Engadget analizó cómo puede beneficiar la búsqueda de datos.

    "La herramienta proporciona un acceso más directo a los datos presentados en un estándar abierto que deja en claro quién creó la información, cómo se recopiló y cómo se le permite usarlo. No solo puede rastrear datos climáticos para un informe, pero asegúrese de que sea relevante y legal de usar ".

    Este es un impulso global (como en el internacional) que funciona en varios idiomas con soporte para idiomas adicionales próximamente. James Vincent en El borde Noy citó:"Creo que en los últimos años el número de repositorios se ha disparado".

    "Simplemente ingrese lo que está buscando y lo ayudaremos a guiarlo al conjunto de datos publicado en el sitio del proveedor del repositorio, ", dijo. Actualmente, Los conjuntos de datos y los datos relacionados tienden a estar distribuidos en varios repositorios de datos y uno podría encontrar que la información sobre estos conjuntos de datos no está vinculada ni indexada por los motores de búsqueda. Para la persona que realiza una búsqueda, el descubrimiento de datos se vuelve tedioso en el mejor de los casos.

    Están seriamente a favor de un ecosistema en el que se alienta a los propios proveedores de conjuntos de datos, a través de las directrices que desarrolló Google, para describir sus datos "de manera que Google (y otros motores de búsqueda) puedan comprender mejor el contenido de sus páginas, " ella dijo.

    Utilizaron el estándar abierto schema.org para abordar este tema. En la lista de deseos de Noy:que todos los proveedores de conjuntos de datos respalden este estándar común. Se espera que más repositorios de datos usen el estándar schema.org para describir sus conjuntos de datos. De esa manera, dijo Noyes, Los conjuntos de datos son parte de un "ecosistema robusto".

    "Una herramienta de búsqueda como esta es tan buena como los metadatos que los editores de datos estén dispuestos a proporcionar. Esperamos que muchos de ustedes usen los estándares abiertos para describir sus datos, permitiendo a nuestros usuarios encontrar los datos que están buscando ".

    Jon Fingas en Engadget :"Está lejos de ser un recurso definitivo en este momento. Es un comienzo, sin embargo, y Google sin duda espera que esto anime a otros a hacer que sus datos públicos sean más fáciles de buscar ".

    Y si todo esto fuera poco Google abrirá algunos caminos para aprovechar al máximo los datos sobre datos sobre datos.

    De acuerdo a El borde , Jeni Tennison, jefe del Open Data Institute, dijo que, idealmente, Google publicará su propio conjunto de datos sobre cómo se utiliza la búsqueda de conjuntos de datos. Dijo que Google debería publicar un conjunto de datos sobre la búsqueda de conjuntos de datos que sería indexado por Dataset Search, añadió Vincent. Él la citó:

    "Es importante comprender simplemente cómo buscan las personas ... qué tipo de términos usan, cómo los expresan, ", dice Tennison." Si queremos familiarizarnos con la forma en que las personas buscan datos y hacerlos más accesibles, sería fantástico que Google abriera sus propios datos sobre esto ". En otras palabras, él agregó, Google debería publicar un conjunto de datos sobre la búsqueda de conjuntos de datos que sería indexado por Dataset Search.

    © 2018 Tech Xplore




    © Ciencia https://es.scienceaq.com