miércoles, 29 de febrero de 2012

Utilizacion de índices en Estructuras de Datos: Arbol Binario Arbol AVL y Arbol B


           El índice puede definirse como una entidad que opera con un procedimiento que acepta información acerca de cierto valor de atributo, como entrada, y provee como salida una información que permite la rápida localización del registro de le llama primario al índice que utiliza como entrada la llave primaria y da como salida una información referente a la ubicación física del registro.
           Para que la búsqueda sea más eficiente y reducir el tamaño del archivo índice, los campos referentes a la información asociada se almacenan separadamente, con los cual se tendrá que considerar una colección ante la llave y los datos asociados, esta es a través de un indice.
            Teniendo al apuntador fuera de la estructura de datos se puede calificar al archivo como índice, en cual consiste básicamente en una colección de pares, llaves-dirección.



Arbol Binario
Permite procesar el archivo secuencialmente por orden lógico y también procesarlo aleatoriamente.
 Si se tiene una indexación es conveniente para archivos con mediana volatilidad, actividad variable y tamaño relativamente estable.
Aunque existen desventajas
- Número de accesos en la búsqueda binaria
- Mantener ordenado el archivo de índices

 ARBOL B
            Una de las estructuras que más ampliamente se ha  usado para organizar un índice en un sistema de base de datos y en administradores de archivos tradicionales es el árbol B. (B Tree).
            Un árbol B es una clase especial de árbol multicamino equilibrado que permite recuperar, eliminar e insertar registros de un archivo extremo con buen rendimiento en el peor caso.
Permite mantener ordenado el índice fácilmente
Dependiendo del orden del Arbol B, se puede obtener un gran rendimiento, por ejemplo si tenemos un árbol de orden 25, el nodo tendrá 50 llaves y puede encontrar cualquier llave de entre 1,000,000 con tan solo 4 accesos a disco
         Hay varias formas de organizar las hojas, una de ellas es que el archivo principal esta almacenado solo en las hojas, y que cada hoja ocupa un bloque. También es importante hacer notar si se trata de un índice denso, en tal caso se tendrá que mantener en cada nodo la dirección de la información asociada al valor de la llave, o si se trata de índice disperso donde se tendría ciertos valores de llaves en el índice y en las hojas existirían todos los valores de llaves que propiamente es el archivo principal.


En un árbol B+, todas las llaves en las hojas. Los niveles superiores, los cuales están organizados como un árbol B, consisten únicamente de un índice para localizar rápidamente. 
              La lista de hojas es referida como el conjunto secuencia, lo cual permite un fácil procesamiento secuencial.

              Para el proceso de búsqueda se realiza desde la raíz del árbol a través del índice hasta una hoja. Ya que todas las llaves residen en las hojas, no todos los valores de llaves son encontrados en la trayectoria de búsqueda, si no hasta llegar a la hoja correcta



Conclusion

Teniendo en cuenta la interaccion con la que se cuenta con sistemas de archivos y asi mismo con la información que  en ella existen, los cuales podemos  borrar, modificar y clasificar  de acuerdo  a la información que en ellos contengan podiendo acceder mediante índices es mucha mas rápida.


No hay comentarios:

Publicar un comentario