sábado, 16 de junio de 2007

BUSQUEDA DE INFORMACIÓN POR INTERNET

INTRODUCCIÓN

Internet no es sólo una red, sino una red de redes que engloba bajo su extenso manto una
inmensa cantidad de información referente a cualquier tema que podamos imaginarnos. Para
buscar en esta inmensidad no existen archivos ni servidores centrales, sino que la información
esta dispersa en el ciberespacio infinito. Por este motivo, la búsqueda de información puede
resultar una tarea ardua y frustrante. Para paliar dicho problema se presentan a continuación
las herramientas y servicios que facilitan la tarea de búsquedas en Internet.


Buscadores Web.

Un Motor de búsqueda, o popularmente un Buscador, es una página Web que permite buscar
otras páginas de acuerdo a una condición de búsqueda que define el usuario. Por ejemplo, con
la ayuda de un buscador podemos localizar las páginas que hablan de una determinada
persona o empresa, las referencias existentes a un libro o un disco, o todas las páginas que
hablan sobre un acontecimiento concreto.
El usuario debe introducir los términos de búsqueda y realizar la consulta. El buscador
devuelve las direcciones web que estén relacionados con dichos términos. Para ello examinan
la URL’s de las paginas, su título o su contenido. El resultado se muestra en una página que
contiene el titulo y una breve descripción de las paginas encontradas. Algunos buscadores

Indices

Buscadores que recorren la red e indexan lo que encuentran y lo almacenan en una base de
datos. Como resultado, estos buscadores tienen grandes bases de datos que relacionan páginas
web con claves. Buscar supone consultar la base de datos usando sus palabras clave como
índices.
Son los buscadores que mantienen una organización de las páginas incluidas en su base de
datos por categorías, es decir, tienen un directorio navegable de temas. Dentro de cada
directorio podemos encontrar páginas relacionadas con ese tema. Para mantener esta
organización, los buscadores tienen unos administradores humanos que se encargan de visitar
las páginas y vigilan que todas se encuentren clasificadas en su lugar correcto. Índices típicos
son Yahoo o Excite.
Para que una página quede registrada en un índice debemos mandarles la dirección a los
administradores humanos de ese índice, generalmente acompañada de una serie de datos que
les ayuden a clasificar la página de una forma correcta, como la descripción, temática, titulo,
lenguaje, etc. Además, si queremos que varias páginas de nuestro sitio web estén en el
buscador, deberemos registrarlas todas ellas una a una.

Motores de búsqueda

Son buscadores que basan su recolección de páginas en un robot, denominado araña, que
Recorre constantemente Internet en busca de páginas nuevas que va introduciendo en su base
de datos automáticamente. Los motores de búsqueda, no tienen porque tener un índice,
aunque cada vez es más habitual que dispongan de uno. Motores de búsqueda típicos son
Google o Altavista.
Los motores de búsqueda no necesitan que les mandemos la dirección de nuestra página para
tenerla en su base de datos, puesto que el robot puede haberla encontrado previamente. De
todos modos, nosotros podemos mandarles la dirección si no deseamos esperar a que el
robot nos encuentre, práctica muy habitual.
Para clasificar una página, los motores de búsqueda son capaces de leer el contenido de esta y
encontrar aquellos datos que permitan su catalogación. Por eso, cuando registramos una
página en un motor de búsqueda generalmente no nos piden información adicional, como
ocurría con los índices.
Cuando un robot recorre nuestra página guarda sus datos, y luego se dirige a las distintas
páginas que están enlazadas a esta. De este modo, solo hace falta registrar la página inicial de
un sitio web, pues el motor de búsqueda se encargará de recorrer todo el sitio de manera
automática. Adicionalmente, estos motores o arañas, volverán a recorrer las páginas de su
base de datos en busca de cambios que se hayan producido en estas, con objetivo de mantener
su información lo más actualizada posible.

Multibuscadores

Estos últimos no tienen una base de datos propia, lo que hacen es buscar la página en varios
buscadores simultáneamente y combinar los resultados de la búsqueda. Como ejemplo de
multibuscador podemos citar MetaCrawler
http://www.metacrawler.com/index.html

Otras clasificaciones

Aparte de la clasificación anterior de los buscadores, también se pueden distinguir de otras
formas. Existen múltiples métodos de búsqueda que corresponden a diferentes clasificaciones
de la información por temas o categorías, a sistemas automáticos, a sistemas gráficos y a
búsquedas por tipo de recurso. Según las búsquedas que permiten, hay tres tipos de
buscadores:
• Buscadores automáticos: requieren los términos de búsqueda en lenguaje natural o
en alguna notación determinada y a partir de dichos términos encuentra los
documentos web que contengan los términos o palabras clave introducidos. De este
tipo son Google, Noxtrum, Altavista, Lycos o Infoseek.
Buscadores temáticos: tienen la base de datos de búsqueda clasificada por temas o
categorías y permiten realizar búsquedas por distintos índices, yendo desde temas más
generales a temas más específicos. Ejemplos de este tipo son Yahoo y Excite.
Buscadores especializados: la búsqueda abarca un área de conocimiento específico.
Estos buscadores suelen proporcionar información más detallada. Ejemplos de este
tipo son Mappy.com , Infobel.com, Four11.com, Whowhere.com, etc.
De ámbito geográfico: los hay internacionales, nacionales, incluso de regiones más
pequeñas, como provincias o ciudades. Ej: VilaWeb, Cercat o AfricaOnLine.
5

Buscadores populares.


Actualmente, casi todos los buscadores son mixtos, incluyendo varios niveles de directorios y
búsqueda general indexada. Según la búsqueda a realizar utilizaremos un tipo u otro.
Algunos de los buscadores más importante, son: google, yahoo,etc.

Técnicas de búsqueda


Cuando se realizan búsquedas pueden presentarse algunos problemas como:
• El buscador devuelve muchos resultados
• El buscador no devuelve ningún resultado o devuelve muy pocos.
• El buscador tarda mucho en resolver la consulta.
Para resolverlos algunos consejos útiles son:
• Utilizar un numero adecuado de palabras clave
• Utilizar la búsqueda de frases utilizando “ “
• Utilizar operadores lógicos
• Excluir palabras similares
• Utilizar los distintos campos que ofrece el buscador y las búsquedas avanzadas

REFERENCIAS

www3.uji.es/~huerta/j11/tema7.pdf




No hay comentarios: