jueves, 12 de mayo de 2011

Motores de busqueda

Motor de búsqueda

Un motor de búsqueda, también conocido como buscador o browser es un sistema informático que busca archivos almacenados enservidores web gracias a su «spider» (o Web crawler). Un ejemplo son los buscadores de Internet (algunos buscan sólo en la Web pero otros buscan además en noticias, servicios como Gopher, FTP, etc.) cuando se pide información sobre algún tema. Las búsquedas se hacen con palabras clave o con árboles jerárquicos por temas; el resultado de la búsqueda es un listado de direcciones Web en los que se mencionan temas relacionados con las palabras clave buscadas.
  1. Los Spiders: La mayoría de grandes sitios internacionales que todos usamos y conocemos son de este tipo. Requieren muchos recursos para su funcionamiento. No están al alcance de cualquiera.
    • Recorren las páginas recopilando información sobre los contenidos de las páginas. Principalmente el texto que en ellas aparece. Cuando buscamos una información ellos consultan con su software en su base de datos, con la información que han recogido de las páginas, y nos la presentan clasificados por su relevancia. De las webs, los buscadores pueden almacenar desde la página de entrada, a todas las páginas de la web. Depende de los gustos del buscador, y la consideración de importancia que tenga la web para ellos.
    1. Los Directorios:
      Una barata tecnología, que es ampliamente utilizada por la cantidad de programas scripts en el mercado. No se requieren muchos recursos de informática. Están muy extendidos en la red por estos motivos. En cambio, se requiere mas soporte humano y mantenimiento.
      • Son completamente distintos a los spiders. En estos, los algoritmos son mucho mas sencillos, presentando la información sobre las webs registradas como una colección de directorios. No recorren las webs ni almacenan sus contenidos. Solo registran algunos de los datos de nuestra página. Como el título y la descripción de la web que se introduzcan a la hora de registrar las webs.

    2. Los sistemas mixtos Buscador - Directorio:
    3. Son una mezcla entre spider y directorio. Además de tener características de arañas, presentan las webs registradas en catálogos sobre contenidos. Informática, cultura, sociedad. Que a su vez se dividen en subsecciones.
Metabuscadores
Metabuscadores. Lo que hacen, es realizar búsquedas en otros sitios, analizan los resultados de la página, y presentan sus propios resultados.
No suelen ser bien venidos por los portales.


Multibuscadores
Es una categoría que oficialmente, no existe. Digamos que no está muy extendida, y que he puesto aquí, porque nosotros lo utilizamos. Permite lanzar varias búsquedas en webs seleccionados respetando el formato original de los resultados. Hemos desarrollado nuestra propia tecnología de multibuscadores.

FFA Enlaces gratuitos para todos
FFA, página de enlaces gratuitos para todos. Cualquiera puede inscribir su página durante un tiempo limitado en estos pequeños directorios. Los enlaces, no son permanentes.


Buscadores de Portal
Bajo este título, englobamos los sistemas específicos de sitio. Aquellos que buscan información solo en su portal o sitio web. Podríamos considerarlos como un directorio. No obstante, como están basados en expresiones regulares y consultas SQL, vamos a intentar ayudarles a manejar mejor estas herramientas.


WWW: En informática, la World Wide Web es un sistema de distribución de información basado en hipertexto o hipermedios enlazados y accesibles a través de Internet.

HTTP:Hypertext Transfer Protocol o HTTP (en español protocolo de transferencia de hipertexto) es el protocolo usado en cada transacción de la World Wide Web. HTTP fue desarrollado por el World Wide Web Consortium y la Internet Engineering Task Force,

HTML: siglas de HyperText Markup Language (Lenguaje de Marcado de Hipertexto), es ellenguaje de marcado predominante para la elaboración de páginas web

dominio: de Internet es una red de identificación asociada a un grupo de dispositivos o equipos conectados a la red Internet.

Protocolos TCP/IP.:
a dirección IP es el identificador de cada host dentro de su red de redes. Cada host conectado a una red tiene una dirección IP asignada, la cual debe ser distinta a todas las demás direcciones que estén vigentes en ese momento en el conjunto de redes visibles por el host. En el caso de Internet, no puede haber dos ordenadores con 2 direcciones IP (públicas) iguales.