Yahoo!, singular y plural

·

Si ayer comentaba que hay patentes que te llegan a sobre coger por lo amplias que pueden ser, a veces otras te sorprenden por lo sencillas y efectivas que son. Y este es el caso que ha patentado Yahoo!, un sistema que busca palabras en singular y/o plural y reconstruye la consulta de búsqueda para tener mejores resultados.

La patente llamada Word pluralization handling in query for web search básicamente lo que hace es analizar la consulta de búsqueda, buscar aquellos conceptos que tengan un equivalente en singular o plural (dependiendo del caso) y reconstruye la consulta y es la que se ejecuta, de forma transparente para el usuario.

Para esto se usaría un diccionario de palabras relacionadas basadas en las consultas anteriores de muchos usuarios. Como curiosidad, en Google Webmaster Tools ya hay una sección en la que podemos encontrarnos un listado de palabras y «sus variantes» como ellos lo denominan, que en muchos casos coincide con lo que podría ser este diccionario, aunque para Google una variante es más que un singular-plural y puede ser una palabra sinónima.

Creo que la figura lo deja más que claro en este caso:

To find the most relevant files, search engines typically try to select, from among a plurality of files, files that include many or all of the words that a user entered into a search request. Unfortunately, the files in which a user may be most interested are too often files that do not exactly match the words that the user entered into the search request. If the user enters the singular form of a word in the search request, then the search engine may fail to select files in which the plural form of the word occurs. The reverse can occur as well and a user enters the plural form a word in a search and the search engine fails to select files in which the singular form occurs. For example, the word «shoe» is different from the word «shoes.» Thus, entering the search term «shoes» would preclude all web documents that contain «shoe.» As a result, the search engine may return sub-optimal results for the particular query.

Up to 50% of queries directed to web search engines possess at least one term in the search query that may be transformed either from singular to plural form or plural to singular form. However, among these 50% of queries, only 25% would benefit from pluralization or de-pluralization. Thus, a substantial number of pluralization or depluralization is not useful and should be avoided. In addition, for a good user experience when using search engines, the user will require that search engine perform searches of their queries quickly and with the most relevant results. Thus, there is a clear need for techniques to determine when and how to convert words in a query to its plural or non-plural form in order to provide the most relevant search results while minimizing computational overhead associated with the search.

Los datos que Yahoo! aporta son bastante interesantes: la mitad de las consultas de búsqueda suelen tener algún concepto que se puede poner en singular y en plural, y de esos resultados, un 25% se aprovecharía de este sistema (lo que significaría un 12% del total de las búsquedas que se hacen, que no es poco).

Tal y como muestra la imagen, lo que se conseguiría es algo del estilo a cambiar la consulta [zapatillas para correr] por [(zapatillas OR zapatilla) para correr], que, la verdad, dan resultados bastante distintos.

Comments

2 respuestas a «Yahoo!, singular y plural»

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *