lunes, 11 de junio de 2007

Introducción a los buscadores de internet


El siguiente resumen trata de los elementos básicos para comprender el uso de tags como herramienta de optimización de páginas de internet para motores de busqueda, así como una ligera reseña de los principales buscadores de la escena en internet.


1. Meta Elementos


Los Meta Elementos son componentes HTML usados para proveer datos estructurados sobre una página web. Esos elementos son colocados como etiquetas (tags) en la sección "head" del documento HTML.


2. Indexación de Meta Tags


Las páginas web pueden contar con información oculta que indica a los buscadores quién es el autor, palabras clave, descripción del documento y lenguaje.


Para las páginas HTML, la meta tag contiene palabras clave que también son incluidas en los índices creados por los buscadores.


3. Meta Elementos en la optimización de búsquedas


Los meta elementos proveen información sobre una página dada y ayudan a los buscadores a categorizarlas correctamente. Estos elementos son insertados en el documento HTML, pero no son directamente visibles por el usuario cuando visita el sitio.


Estos elementos son el foco de un área de la mercadotecnia conocida como Optimización para Motores de Búsqueda (Search Engine Optimization, SEO), a través del cual se usan diversos métodos para dotar al sitio de un usuario de una clasificación más alta en los buscadores.


Los meta elementos tienen menor incidencia en los resultados de búsqueda hoy en día que a mediados de la década pasada, debido a que las arañas o robots de los buscadores se han vuelto más sofisticados y otorgan mayor importancia a las páginas externas que se vinculan con el sitio, la cantidad y calidad del contenido, la precisión técnica del código fuente, la cantidad de vínculos funcionales, el volumen y consistencia de búsquedas o tráfico, el tiempo promedio de visita, número de páginas vistas, nuevas sesiones, tasas click-through, geografía, lenguaje, y otras características intrínsecas.


4. ¿Qué es un buscador?


Un buscador de Internet o motor de búsqueda es un sistema de recuperación de información en los sistemas conectados a la red mundial de internet.
Los motores de búsqueda permiten solicitar contenidos que cumplen con criterios específicos, que típicamente están contenidos en una palabra o frase dadas, y regresa al usuario una lista de contenidos que empatan con esos criterios.


Esta lista normalmente está ordenada con respecto a alguna medición de la relevancia de los resultados. Los motores de búsqueda usan regularmente índices actualizados para operar de manera rápida y eficiente.


Los motores de búsqueda se diferencian de los Directorios Web, ya que éstos últimos son mantenidos por editores, y los primeros operan con algoritmos o son una combinación de algoritmos y decisiones humanas.


5. Buscadores líderes


Google


Google comenzó a tener gran prominencia a partir de 2001. Su éxito se basa en parte en el concepto de popularidad de enlaces y su PageRank.


El número de sitios y páginas que se ligan con una página web específica es tomado en cuenta mediante la clasificación PageRank, bajo la premisa de que los sitios buenos y deseables tienen más vínculos desde otros sitios.


El PageRank de páginas vinculadas y el número de vínculos en tales páginas contribuyen al PageRank de la página en cuestión.


Google y el resto de los motores de búsqueda no sólo usan el PageRank, sino más de 150 criterios para determinar la relevancia de un sitio.


El algoritmo “recuerda” los sitios donde ha estado e indexa el número de vínculos cruzados, relacionando a éstos en grupos.


Yahoo! Search


Yahoo tiene su propio motor de búsqueda basado en la combinación de tecnologías, resultado de su adquisición de otros buscadores como Inktomi, Overture, AlltheWeb y AltaVista. Este buscador privilegia los resultados de su motor de búsqueda sobre los resultados arrojados por su Directorio Web.


Microsoft


Es el más joven de los principales motores de búsqueda. Anteriormente basaba sus resultados de búsqueda en Inktomi (ahora propiedad de Yahoo), pero a partir de 2006 migró sus búsquedas a una nueva plataforma WindowsLiveSearch, con lo que retiró el nombre MSN Search.


6. ¿Cómo trabajan los motores de búsqueda?


Los motores de búsqueda operan con el siguiente orden de acciones:


1. Web Crawling (arañas)


2. Creación de índices


3. Resultados de la búsqueda


Los motores de búsqueda trabajan a través del almacenamiento de información sobre un gran número de páginas web, que son obtenidas de la propia red.

Estas páginas son recuperadas por un Web Crawler (algunas veces llamados arañas), que son navegadores automatizados que siguen cada vínculo que encuentran en un sitio dado.


Los contenidos de cada página son analizados para determinar cómo debe ser indexada (por ejemplo, se obtienen palabras de los títulos, encabezados o espacios especiales llamados meta tags). La información sobre las páginas son almacenadas en una base de datos para su uso en búsquedas posteriores.


Algunos motores de búsqueda como Google almacenan todo o parte de una página fuente (a lo que le llama Caché), así como información sobre las páginas. En tanto, otros buscadores almacenan cada palabra de todas las páginas que encuentran.


Cuando un usuario realiza una búsqueda, normalmente tecleando palabras clave, el motor busca en su índice y provee una lista de las páginas que mejor empatan con los criterios, normalmente con un sumario corto que contiene el título del documento y algunas veces parte de su texto.


La mayor parte de los motores de búsqueda usan los términos booléanos AND, OR y NOT para hacer búsquedas más específicas. Una característica avanzada de los buscadores es la búsqueda de proximidad, que permite a los usuarios definir la distancia entre las palabras clave.


Las tecnologías de búsqueda actuales podrían cambiar en el futuro de acuerdo con el desarrollo de Internet.


Muchos motores de búsqueda son empresas comerciales financiadas por ingresos por publicidad, como resultado algunas emplean la práctica controversial de permitir a sus anunciantes pagar dinero para aparecer en los primeros resultados de búsqueda.
La mayoría de los motores de búsqueda son operados por compañías privadas que usan algoritmos propios y bases de datos cerradas.


El proceso de creación de índices se refiere a la manera en que la información obtenida por las arañas es almacenada para facilitar su recuperación de manera rápida y precisa.


El diseño de índices incorpora conceptos interdisciplinarios de lingüística, psicología cognitiva, matemáticas, informática, física y computación.


Los buscadores populares se enfocan en el indexado del texto completo de documentos redactados en lenguaje humano en internet, aunque existen otros tipos de archivos que pueden ser buscados como son video, audio y gráficos.


7. Keywords


Una palabra clave en las búsquedas de internet es usada para encontrar páginas coincidentes en la red. Se popularizaron durante los primeros años del desarrollo de los buscadores debido a que no era posible realizar preguntas en “lenguaje natural” para encontrar los sitios deseados.


Las búsquedas eran más eficientes al proporcionar sólo algunas palabras clave. Estas palabras capturaban la esencia del tema en cuestión y aparecían destacadas en la lista de resultados del motor de búsqueda.


Las palabras clave son utilizadas aún. Muchos buscadores modernos emplean métodos para determinar cuáles palabras en una instrucción de búsqueda son importantes y, por tanto, deben ser tratadas como keywords.


Las palabras más comunes como los artículos (un, una, el, la, los) y las conjunciones (y, o, pero) no son tratadas como palabras clave y son ignoradas por los buscadores, con el propósito de reducir los resultados de búsqueda.


Una lista de palabras hispanas ignoradas por buscadores puede ser consultada en el siguiente URL.


8. Prácticas prohibidas: Keyword stuffing


Ésta es considerada una práctica sin ética de las técnicas de Optimización para Motores de Búsqueda (SEO). Este procedimiento consiste en la utilización repetitiva o engañosa de palabras clave en los meta elementos o en el contenido.


Estos procedimientos pueden ser usados para obtener un mayor ranking y visibilidad para frases particulares en los motores de búsqueda. Una palabra que es repetida muchas veces puede ser detectada por los buscadores; en particular, se sabe que Google expulsa de sus índices a los sitios que emplean esta técnica y reduce significativamente el ranking de los sitios que recurren a ella.


Igualmente es considerado Keyword Stuffing la inserción como metaelementos de palabras clave que son buscadas con frecuencia (como la palabra sexo), aún cuando esa palabra tenga poca conexión con el contenido de una página, con el fin de atraer tráfico de manera engañosa.


La elección de palabras como Metatags debe ser determinada con el fin de beneficiar a los usuarios al hacer más eficientes las búsquedas de páginas relevantes, y jamás como un medio de engaño para aumentar el tráfico web.


9. Retos para los motores de búsqueda
Internet está creciendo más rápido de lo que cualquier tecnología actual de motores de búsqueda puede indexar.


Muchas páginas de internet son actualizadas frecuentemente, lo que obliga a los motores de búsqueda a visitarlos periódicamente.


Las búsquedas que se realizan actualmente están limitadas a la búsqueda de palabras clave, lo que puede resultar en muchos resultados falsos.


Los sitios generados de manera dinámica pueden ser lentos o difíciles de indexar por los buscadores. Muchos sitios generados de manera dinámica no pueden ser indexados por motores de búsqueda. Este fenómeno es conocido como la Red Invisible.


Algunos motores de búsqueda no clasifican sus resultados con respecto a la relevancia, sino por la cantidad de dinero invertido en publicidad.


10. Fuentes


The Anatomy of a Large-Scale Hypertextual Web Search Engine.


Nielsen NetRatings Search Engine Ratings.


How Google Finds Your Needle in the Web's Haystack.


Seeking Better Web Searches.


Effective Web Crawling.


Crawling towards Eternity.


Crawling a Country: Better Strategies than BreadthFirst for Web Page Ordering.


Google Delists BMW-Germany.

No hay comentarios.: