La "caza de virus" no es lo que la gente piensa, no es una ciencia exacta basada el la observación directa de la naturaleza. Es una ciencia mas teórica que práctica - como la astronomía - basada en interpretaciones de medidas indirectas de acuerdo y en teorías no falsables (axiomas).
La manera en que los "cazadores de virus" realizan su trabajo se llama "
agrupación de secuencias" (sequence clustering), y
NO ES UNA RAMA DE LA MEDICINA, sino de la informática!!!!
La
agrupación de secuencias es una disciplina bioinformática INEXACTA. Se usan algoritmos de matiz estadístico o probabilístico para INTENTAR agrupar secuencias que "parecen" relacionadas "de alguina manera". Fíjense en la imprecisión del lenguaje utilizado.
Sequence clustering: Facts In bioinformatics, sequence clustering algorithms attempt to group sequences that are [b]somehow related. The sequences can be either of genomic, "tran******omic" (ESTs) or protein origin. ...
Piensen en un rompecabezas con infinitas soluciones posibles e igual de plausibles. Este rompecabezas SIN SOLUCIÓN ÚNICA Y SIN REGLAS UNICAS PARA SU SOLUCION, es el paso previo a la reconstrucción del RNA del supuesto virus.
Que RNA se está reconstruyendo entonces? Un RNA FICTICIO.
Generalmente los algoritmos trabajan sobre un grafo de enlaces transitivos, intentando encontrar ciclos cerrados de secuencias que comparten una "similaridad" (primera fuente de incertidumbre) superior a un nivel determinado (segunda fuente de incertidumbre). A cada par de secuencias se le dan "puntos" de similaridad basándose en la alineación mutua de subsecuencias.
El grafo resultante se somete a un algoritmo de agrupamiento, de los que existen INFINITAS VARIEDADES - k-means, density, flow simulation.... - que producen RESULTADOS DIFERENTES (tercera fuente de incertidumbre):
Parallel K-Means Clustering Algorithm on DNA Dataset
BAG: A Graph Theoretic Sequence Clustering Algorithm
Exploring a Bioinformatics Clustering Algorithm
Clustering and Subspace Clustering in Genomics and Bioinformatics | 2008-2009 Series
Analysis of ribosomal RNA sequences by combinatorial clustering
A bottom-up clustering algorithm to detect ncRNA molecules with a common secondary structure
..etc..etc... y como estas cientos de variedades... todas con modelos teóricos, parámetros y resultados diferentes.
El genoma reconstruido del nuevo virus será MUY DIFERENTE según el valor elegido - a gusto personal del científico - de estas tres variables:
1- Medida de similaridad elegida.
2- Valor mínimo de similaridad escogido.
3- Tipo de algoritmo elegido y sus parámetros particulares.
Por lo tanto, señoras y señores, ESTAN DANDO PALOS DE CIEGO, reconstruyendo secuencias CON UN GRADO DE INCERTIDUMBRE ENORME, que dependen en su totalidad de los algoritmos y modelos utilizados, de los que NO EXISTE UNA SOLUCIÓN ÚNICA.
Y para colmar el vaso de la ineficiencia,
NI SE MOLESTAN en demostrar que el supuesto agente es el causante de la enfermedad, para lo que existen un procedimiento establecido por Koch que SE PASAN TOTALMENTE POR EL FORRO.