Iniciado por
indenaiks
Las fases de la indexación de mensajes de los ppcc´s es esta:
FASE 1: IDEALISTA
1 - Creación del bot de captura/actualización. Hecho.
2 - Ejecución del bot y vertido de información estructurada e indexada en la base de datos SQL. Hecho.
3 - Creación de reporte con IReport con salida a archivo PDF que enlace cada mensaje a la web de origen. Casi hecho, primera versión sin links ya lanzada.
4 - Afinamiento de los mensajes que pudieran faltar y que otros foreros pudieran encontrar que faltan (el filtro SQL es imperfecto). Esto está por hacer 
Si me permite una apreciación, se podría indexar todo el texto en una bb.dd. para poder buscar resultados por palabra (igual que hace Google) aunque referenciando a los artículos concretos. Para ello sólo necesitaría los ficheros .pdf o, mejor todavía, la información en texto puro.
Por cierto, yo también escribo por Idealista a veces usando un nick parecido a la palabra quiebra, aunque hace un tiempo que no posteo por allí.