Incluir en mis sitios favoritos
Ingresar Salir Inscribirme
Buscar Ayuda Contactar Ingresar Directorio Ultimos
Búsqueda avanzada
Preguntas frecuentes
BUSCAR EN: BLOGS FOTOS
 

Hola, Invitado
Ingresar  Inscribirme
En línea: 203 visitantes

Alemania (2)
Argentina (52)
Belice (2)
Bolivia (11)
Brasil (7)
Canadá (1)
Chile (18)
Colombia (18)
Costa Rica (26)
Cuba (20)
Dominicana, República (17)
Ecuador (5)
El Salvador (18)
España (179)
Estados Unidos (12)
Francia (2)
Guatemala (12)
Honduras (3)
Israel (0)
Italia (2)
Jamaica (0)
México (46)
Nicaragua (3)
Países Bajos (0)
Panamá (14)
Paraguay (6)
Perú (21)
Puerto Rico (6)
Reino Unido (1)
Uruguay (9)
Venezuela (38)





Búsquedas recientes

Lo más popular

Lo más buscado este mes

Archivo Weblogs


DIRECTORIO WEBLOGS :: España > Ciencia Incluir BlogEspaña >  Ciencia Weblogs de Yaaqui.com DIRECTORIO WEBLOGS
Ciencia Kanija
creado con http://wordpress.org/?v=3.3.1  en Blogueros
ENVIAR A UN AMIGO
Para subscribirse a  requiere identificarte
Usuario: Ingresar

Weblog de Ciencias y aspectos curiosos
Toda la ciencia a tu alcanceVisitarCiencia Kanija
Dirección URLhttp://www.cienciakanija.com    Registrado:24-Jun-2010
Compartir:

Compartir en Facebook Compartir en Twitter Stumble It More...


Enviar a email
Visitar Cómo construir un mejor motor de búsqueda de ADN Cómo construir un mejor motor de búsqueda de ADN en Biologí­aTecnologí­abioinformáticabúsquedas
Por Kanijo
el 13-Jul-2010

BúsquedasLas técnicas para indexar sitios web en el idioma chino podrían mejorar drásticamente la velocidad de las búsquedas bioinformáticas, de acuerdo con una investigación realizada por SOSO, el tercer mayor motor de búsquedas de China.

Si hay algo que nos ha enseñado Google a la actual generación de usuarios de la red, es que las búsquedas por Internet son rápidas. La pequeña impresión encima de cada búsqueda ha marcado esta idea en la cultura de las búsquedas.

Escribe la palabra “física” en el motor de búsqueda, por ejemplo, y arroja 102 millones de resultados en 0,21 segundos. Eso es asombrosamente rápido.

Esto podrían ser buenas noticias para los investigadores que peinan las bases de datos bioinformáticas. Estas bases de datos son descomunales, y crecen exponencialmente. Contienen, por ejemplo, el número que crece incesantemente de especies distintas en el planeta, así como los genomas de distintos individuos de la misma especie.

Dada nuestra experiencia con la búsqueda en la red, es fácil imaginar que encontrar que un gen es común a más de un organismo o individuo sería tan rápido como una búsqueda en Google. Pero no lo es.

La razón, de acuerdo con Wang Liang, científico de la computación en SOSO.com, uno de los tres grandes motores de búsqueda de China, es que la bioinformática no ha tenido éxito al explotar las técnicas de búsqueda que han hecho tan rápidos a motores como Google.

La mayor parte de las búsquedas bioinformáticas usan los algoritmos BLAST o FASTA. Esencialmente comparan los datos de un genoma con los de otro, y así sucesivamente. Esto es satisfactorio cuando hay un número relativamente bajo de genomas, pero se hace inmanejable cuando el número aumenta exponencialmente.

Los motores de búsqueda se enfrentaron exactamente con el mismo problema hace 20 años, con el crecimiento de la red. Los motores de búsqueda inicialmente indexaban la red registrando palabras clave contenidas en cada documento. La búsqueda de una palabra específica significaba buscarla en una página web, luego en otra, etc. Esta aproximación se hizo cada vez más lenta conforme crecía el número de documentos.

Por lo que los motores tomaron otra aproximación: dieron la vuelta al proceso de indexado creando lo que se conoce como un índice invertido. “La idea del índice invertido es muy simple”, dice Liang.

En lugar de crear una lista de páginas web y las palabras de cada página, el proceso de indexado registra para cada palabra la lista de páginas web en las que aparece.

Por lo que ahora sólo se busca a través de la lista de palabras que el motor de búsqueda ha indexado. Cuando encuentra la palabra, esa entrada también registra las páginas web en las que aparece. En otras palabras, en lugar de buscar en un índice de páginas web para encontrar una palabra concreta, se busca a través de un índice de palabras para encontrar las páginas web en las que aparece.

Esto simplifica drásticamente las cosas pero hay varias complejidades que dificultan el proceso de indexado. Por ejemplo, en inglés, los espacios entre palabras muestran claramente dónde empieza y termina una palabra. Éste no es el caso para los datos genéticos. Por lo que una pregunta importante es qué constituye una palabra.

Liang dice que una pista importante procede de la forma en que los motores de búsqueda indexan lenguajes como el chino, donde no hay espacios entre palabras. Una forma de indexar un documento chino es segmentar el texto en n-gramas, palabras que tienen una longitud de n-letras. Por lo que se empieza segmentando en 1-gramas, palabras de una letra, y luego en 2-gramas, palabras de dos letras. Una búsqueda de una palabra de tres letras, tal como ABC, puede realizarse buscando los 2-gramas AB y BC.

De hecho, algunos motores de búsqueda chinos funcionan exactamente de esta forma, indexando todos los 2-gramas.

Pero, ¿cuántas letras hay en una palabra genética, cuántos n-gramas debería buscar un motor de búsqueda? Una segmentación de 1-gramas da sólo cuatro palabras, las bases de nucleótidos A, T, C y G. Pero eso no es bueno dado que las búsquedas combinadas que necesiten palabras más largas se harán inmanejables.

La respuesta procede de la distribución estadística de las palabras en las secuencias de ADN que Liang dice que sigue la Ley de Zipf. Esto básicamente afirma que en un documento de cualquier longitud, el 50 por ciento de las palabras aparecen sólo una vez. Esto puede usarse para encontrar un tipo de longitud media en las palabras del ADN.

En el chino, por ejemplo, el porcentaje de palabras de 1-gramas que aparecen sólo una vez es menor del 50%, el porcentaje de palabras de 2-gramas que aparecen sólo una vez es de aproximadamente el 50% y el de palabras 3-gramas es de menos del 50 %. Por lo que las palabras de 2-gramas son una buena media.

Liang aplica el mismo criterio para encontrar la longitud media de palabras en los genomas de arabidopsis, aspergillus, la mosca de la fruta y el ratón. Y encontró que una buena longitud media de palabra es de unas 12 letras. Por lo que la mejor forma de indexar los datos del genoma es buscar 12-gramas, dice.

Nada de esto necesita que se complete una nueva tecnología. Liang dice que el motor de búsqueda de código abierto Lucene es el foro perfecto en el cual realizar el trabajo y, de forma impresionante, incluso lo ha usado para construir su propio motor de búsqueda bioinformático rudimentario.

Tiene sentido que los enormes avances realizados en las búsquedas que se han realizado mediante los motores de búsqueda comerciales, puedan encontrar una aplicación en el mundo de la bioinformática. Tal vez incluso hay un decente modelo de negocio en tal plan, por ejemplo mostrando anuncios orientados al tipo de persona que trabaja con las búsquedas bioinformáticas.

La única pregunta es quién llevará la cabeza en este área. Y si este trabajo es algo sobre lo que basarse, parece que el motor de búsqueda chino SOSO tiene el liderato.


Artículo de Referencia: arxiv.org/abs/1006.4114: How To Build A DNA Search Engine Like Google?
Fecha Original: 30 de junio de 2010
Enlace Original

This page is wiki editable click here to edit this page.




Leído 6 veces

Para Subscribirse a  requiere identificarse antes
Cómo construir un mejor motor de búsqueda de ADN en  Weblogs de Yaaqui.com  Blogueros Weblog de Ciencias y

Fotologs
Se predice la existencia de cristales temporales

Foto 0 en  - Se predice la existencia de cristales temporales
Más fotos Se predice la existencia de cristales temporales + fotos




22-Feb-2012
Hubble revela una nueva clase de planeta extrasolar

Foto 0 en  - Hubble revela una nueva clase de planeta extrasolar
Más fotos Hubble revela una nueva clase de planeta extrasolar + fotos


22-Feb-2012
Los planes del CERN para un año de física aún más intenso en el LHC

Foto 0 en  - Los planes del CERN para un año de física aún más intenso en el LHC
Más fotos Los planes del CERN para un año de física aún más intenso en el LHC + fotos


21-Feb-2012

Ciencia Kanija Blogueros

Weblog de Ciencias y aspectos curiosos Ciencia Kanija Toda la ciencia a tu alcance

Cómo construir un mejor motor de búsqueda de ADN
Búsquedas - Cómo construir un mejor motor de búsqueda de ADN Las técnicas para indexar sitios web en el idioma chino podrían mejorar drásticamente la velocidad de las búsquedas bioinformáticas, de acuerdo con una investigación realizada por SOSO, el tercer mayor motor de búsquedas de China. Si hay algo que nos ha enseñado Google a la actual generación de usuarios de la red, es que las [...] [..] Leer nota completa
Subscribirse a Cómo construir un mejor motor de búsqueda de ADN
Publicado 13-Jul-2010 por Kanijo en Biologí­aTecnologí­abioinformáticabúsquedas
Leído 6 veces. Más resultados en Más artículos Cómo construir un mejor motor de búsqueda de ADN Fotos acerca Cómo construir un mejor motor de búsqueda de ADN Cómo construir un mejor motor de búsqueda de ADN en Yaaqui
La Hoja Del Arce MADRID

Blog de opiniones politicamente incorrectas y muy personales. Aquí se habla de Dios, Patria, Justicia, Libertad y todo lo que no está de moda. LA HOJA DEL ARCE

TEORÍA POLÍTICA. LA BUSQUEDA DE LO MEJOR
Foto 0 en  - TEORÍA POLÍTICA. LA BUSQUEDA DE LO MEJOR Cuando los tibios y pasotas se apresuran a soltar la coletilla, de "todos los políticos son iguales" a mí me entra [..] Leer nota completa
Subscribirse a Cómo construir un mejor motor de búsqueda de ADN
Publicado 24-Feb-2008 por ARCENDO en artistas
Leído 27 veces. Más resultados en Más artículos TEORÍA POLÍTICA. LA BUSQUEDA DE LO MEJOR Fotos acerca TEORÍA POLÍTICA. LA BUSQUEDA DE LO MEJOR TEORÍA POLÍTICA. LA BUSQUEDA DE LO MEJOR en Yaaqui
Guasabaraeditor Santo Domingo

SERVICIO DE NOTICIAS en favor de la democracia participativa, el desarrollo humano, la paz, el medio ambiente y la cultura.- OPINIÓN, NOTICIAS Y COMENTARIOS. Haciendo de la lucha contra la pobreza un apostolado templario GUASABARAeditor

Exhorta a construir un mejor país
1 de Enero del 2012, 5:40 PM Exhorta a construir un mejor país Eduardo Estrella (Fuente externa)   SANTO DOMINGO (R. Dominicana).- El candidato presidencial de Dominicanos por el Cambio saludó el año instando a realizar con el esfuerzo de todos los cambios que el país necesita y a tomar la decisión correcta para que de las urnas salga un gobierno de mano firme contra la [..] Leer nota completa
Subscribirse a Cómo construir un mejor motor de búsqueda de ADN
Publicado 31-Dec-1969 por GUASABARAeditor en General
Leído 1 veces. Más resultados en Más artículos Exhorta a construir un mejor país Fotos acerca Exhorta a construir un mejor país Exhorta a construir un mejor país en Yaaqui
El Jamon Y El Vino Mendoza

Otro super blog sobre la tecnología, sobre informática, redes y por sobre todas las cosas.... las cosas de todos los días !! El Jamon y el Vino

Como modificar el orden de busqueda de los nombre de maquinas en Microsoft Windows 2000/2003
La respuesta es simple:NO SE PUEDE !!Una practica común, no mucho pero lo he hecho un par de veces, es cambiar el orden de búsqueda de los nombre de host en un sistema Linux.Simplemente editando el archivo /etc/host.conf uno le puede definir con el parámetro order se le indica al resolver el orden de debe realizar la búsqueda para resolver los nombres de maquinas. Si ci [..] Leer nota completa
Subscribirse a Cómo construir un mejor motor de búsqueda de ADN
Publicado 21-Oct-2008 por noreply@blogger.com (Pablo Var en asidesmedios
Leído 10 veces. Más resultados en Más artículos Como modificar el orden de busqueda de los nombre de maquinas en Microsoft Windows 2000/2003 Fotos acerca Como modificar el orden de busqueda de los nombre de maquinas en Microsoft Windows 2000/2003 Como modificar el orden de busqueda de los nombre de maquinas en Microsoft Windows 2000/2003 en Yaaqui
Altoaragon.blogspot.com Barbastro

Toda la actualidad del Alto Aragón en Internet altoaragon.blogspot.com

El tiempo adverso impide un mejor balance del certamen barbastrense IFB Motor
Foto 0 en  - El tiempo adverso impide un mejor balance del certamen barbastrense IFB Motor Radio Huesca: El mal tiempo ha sido el principal protagonista de la VIII edición de IFB Motor puesto que ha obligado a suspender algunas actividades previstas en el exterior y ha impedido el desarrollo normal del certamen, sobre t [..] Leer nota completa
Subscribirse a Cómo construir un mejor motor de búsqueda de ADN
Publicado 25-May-2008 por Neonauta en artistas
Leído 19 veces. Más resultados en Más artículos El tiempo adverso impide un mejor balance del certamen barbastrense IFB Motor Fotos acerca El tiempo adverso impide un mejor balance del certamen barbastrense IFB Motor El tiempo adverso impide un mejor balance del certamen barbastrense IFB Motor en Yaaqui
Guasabaraeditor Santo Domingo

SERVICIO DE NOTICIAS en favor de la democracia participativa, el desarrollo humano, la paz, el medio ambiente y la cultura.- OPINIÓN, NOTICIAS Y COMENTARIOS. Haciendo de la lucha contra la pobreza un apostolado templario GUASABARAeditor

Vargas dice Freddy es abono para construir un mejor país
20 de noviembre de 2010. SANTO DOMINGO Vargas dice Freddy es abono para construir un mejor país El presidente del Partido Revolucionario Dominicano, Miguel Vargas, afirmó que la vida ejemplar y la entrega de Freddy Beras Goico a las mejores causas nacionales, constituyen un abono a los esfuerzos y luchas del pueblo dominicano por construir una sociedad más justa. Miguel Vargas, su esposa Angelita [..] Leer nota completa
Subscribirse a Cómo construir un mejor motor de búsqueda de ADN
Publicado 31-Dec-1969 por GUASABARAeditor en General
Leído 4 veces. Más resultados en Más artículos Vargas dice Freddy es abono para construir un mejor país Fotos acerca Vargas dice Freddy es abono para construir un mejor país Vargas dice Freddy es abono para construir un mejor país en Yaaqui
Los Que Te Consiguen La Mejor Hipoteca Barcelona

Este es el blog de la empresa "Tu Solución Hipotecaria" en el que informamos y compartimos todas las vicisitudes del sector con internautas intrépidos. RN Blog

Los visados para construir viviendas caen un 16% interanual en noviembre ("peor pero mejor")
[..] Leer nota completa
Subscribirse a Cómo construir un mejor motor de búsqueda de ADN
Publicado 31-Dec-1969 por Los que te consiguen la mejor en General
Leído 1 veces. Más resultados en Más artículos Los visados para construir viviendas caen un 16% interanual en noviembre ("peor pero mejor") Fotos acerca Los visados para construir viviendas caen un 16% interanual en noviembre ("peor pero mejor") Los visados para construir viviendas caen un 16% interanual en noviembre ("peor pero mejor") en Yaaqui
El Blog Verde Blogueros

Biología y medio ambiente Ecología y Medio Ambiente en el Blog Verde Just another WordPress weblog

Como construir una casa ecologica
Pasamos a la segunda parte de nuestro informe especial sobre las casas ecológicas. En nuestro artículo anterior hemos planteado qué aspectos son los que deben prevalecer a la hora de construir una vivienda sostenible. Ahora ... [..] Leer nota completa
Subscribirse a Cómo construir un mejor motor de búsqueda de ADN
Publicado 12-Oct-2010 por silvina en
Leído 9 veces. Más resultados en Más artículos Como construir una casa ecologica Fotos acerca Como construir una casa ecologica Como construir una casa ecologica en Yaaqui
Recuperación De Información - Programa De Sistemas De Información Bogotá

Este espacio tiene como objetivo, informar y proporcionar recursos útiles enfocados a la búsqueda y recuperación de información. Partiendo inicialmente de las memorias vistas en clase de "Recuperación de información" del "programa de sistemas de información" de la "Universidad de la Salle". RECUPERACIÓN DE INFORMACIÓN | PROGRAMA DE SISTEMAS DE INFORMACIÓN | UNIVERSIDAD DE LA SALLE

Google: como Motor de búsqueda para la recuperación de información
El indiscutible rey de los motores de búsqueda, es Google (http://google.com), no solo es el motor de búsqueda mas popular de la red, también propulsa otros motores de búsqueda (normalmente sin ser acreditados). Google realiza una enorme cantidad de tra [..] Leer nota completa
Subscribirse a Cómo construir un mejor motor de búsqueda de ADN
Publicado 31-Dec-1969 por Recuperacion de informacion - en General
Leído 6 veces. Más resultados en Más artículos Google: como Motor de búsqueda para la recuperación de información Fotos acerca Google: como Motor de búsqueda para la recuperación de información Google: como Motor de búsqueda para la recuperación de información en Yaaqui
El Contramentario Blogueros

Weblog de Crítica, creado en la República Dominicana elcontramentario

Los blogs se consolidan como un nuevo motor del cambio social
Foto 0 en  - Los blogs se consolidan como un nuevo motor del cambio social (Vanguardia) Con sólo diez años de existencia a sus espaldas, el blog, o bitácora - diario personal electrónico-, está gestando otra nueva revolución en su breve pero intensa historia. Este año, auguran los expertos, las bitá [..] Leer nota completa
Subscribirse a Cómo construir un mejor motor de búsqueda de ADN
Publicado 02-Jun-2008 por noreply@blogger.com (contramen en artistas
Leído 17 veces. Más resultados en Más artículos Los blogs se consolidan como un nuevo motor del cambio social Fotos acerca Los blogs se consolidan como un nuevo motor del cambio social Los blogs se consolidan como un nuevo motor del cambio social en Yaaqui
Blogs De Guatemala Guatemala

Blogs de Guatemala | Directorio de Blogs, donde los guatemaltecos escriben. Noticias, información, clima, deportes, poesía, opinión, información Blogs de Guatemala Así se escribe en Guatemala. Directorio de Blogs Guatemaltecos

De como casi hacemos quebrar a la Ford Motor Company
Cuando uno se gradúa de bachiller, piensa que al día siguiente lo contratará una empresa transoceánica que le pagará en euros, más un bono de 700 dólares y un incremento salarial después de dos meses de prueba.Después de haber estudiado durante años y ostentar el título que acredita como bachiller industrial con especialidad en algo, ahora que ya se tiene derecho a ser contratado por s [..] Leer nota completa
Subscribirse a Cómo construir un mejor motor de búsqueda de ADN
Publicado 23-Sep-2008 por Blogs de en artistas
Leído 9 veces. Más resultados en Más artículos De como casi hacemos quebrar a la Ford Motor Company Fotos acerca De como casi hacemos quebrar a la Ford Motor Company De como casi hacemos quebrar a la Ford Motor Company en Yaaqui

Advertencia YAAQUI.COM no verifica la veracidad de la información publicada y no se responsabiliza por el uso que se le de a la infomación del contenido publicado en los feeds y weblogs independientes. Las opiniones vertidas en este sitio no necesariamente son nuestras. Nos reservamos el derecho de remover cualqueir material que consideremos inconveniente.



Imagen de un Subaru

Subaru azul
Imagen de una antilope alimentando a su cria

Antilope
Imagen de un Dodge Viper Cobra

Viper Cobra
Clasificados Costa Rica Clasificados Argentina Clasificados de España Clasificados Puerto Rico Envía una Postal