TFM i Exposició GRASS
Conferenciants: Victoria Moneta , Carles Serrat i Víctor Urrea - Dijous 10 de novembre 2011
Dijous 10 de novembre
Aula 16 (Edifici C5, planta baixa)
De 10:30 a 14:00h
* 10:30 - 11:20 Exposició Victoria Moneta (Assaig TFM).
Títol: Estudio de efectividad de fármacos antipsicóticos en pacientes con esquizofrenia. Implementación de una librería en R para estimar la supervivencia no paramétrica condicionada de tiempos sucesivos.
Resum:
Este trabajo está motivado por un estudio clínico cuyo objetivo es evaluar la efectividad de tratamientos farmacológicos en pacientes con esquizofrenia de la red PSSJD (Parc Sanitari Sant Joan de Deu). Dado que el cambio de medicación en pacientes con esquizofrenia es muy frecuente, dando lugar a que un paciente tenga, a lo largo de un período de seguimiento, varios cambios de medicación los cuales pueden depender del estadio anterior, se calculará la supervivencia del segundo fármaco condicionada al tiempo de mantenimiento del primer tratamiento farmacológico mediante los métodos de supervivencia condicionada a 2 tiempos sucesivos (Gómez & Serrat, 2007).
En este proyecto se estudiará la base de datos de pacientes con esquizofrenia de la red PSSJD y se pondrá en contexto estadístico el problema clínico y la terminología médica, se analizarán los datos en general y en particular usando la supervivencia condicionada a 2 tiempos sucesivos. Se implementará la metodología de Gómez & Serrat (2007) en una librería de R, añadiendo una covariante categórica a dicha supervivencia y agregando opciones de resultados, tal como gráfico de supervivencia global y según la covariante. Por último, se aplicarán todas las herramientas informáticas desarrolladas al análisis final y conclusiones para la evaluación de la efectividad de tratamientos farmacológico en pacientes con esquizofrenia.
* 11:20 - 11:40 Exposició Carles Serrat (Assaig xerrada R).
* 11:20 - 11:40 Exposició Carles Serrat (Assaig xerrada R).
Títol:Dos nuevas librerías para análisis de la supervivencia: dcens y bwsurvival.
Resum:
Presentamos dos nuevos paquetes:dcens y bwsurvival para estimar la función de supervivencia de forma no paramétrica bajo situaciones complejas de censura. Las posibilidades numéricas y gráficas de ambas librerías se ilustrarán a partir de ejemplos biomédicos.
* 11:40 - 12:00 Exposició Víctor (Assaig xerrada R).
Títol:AUCRF: una librería para la búsqueda de perfiles genéticos.
Resum:
Uno de los objetivos principales en el estudio de las enfermedades complejas hereditarias es la identificación de perfiles genéticos de riesgo, es decir, la selección del conjunto de variantes genéticas en el genoma humano que mejor predicen el riesgo individual a desarrollar la enfermedad. Para ello se pueden utilizar distintas técnicas de data-mining entre las que se encuentra el Random Forest, una metodología propuesta por Leo Breiman (2001) que consiste en la agregación de múltiples árboles de clasificación y que proporciona un ranking de las variables en función de su relevancia en el proceso de clasificación. Una de las ventajas más importantes de esta metodología es su capacidad para captar patrones no lineales de susceptibilidad. En este contexto, recientemente hemos propuesto una nueva aproximación para la selección de variables a partir del uso del Random Forest y las curvas ROC (Calle et al. 2011).
Una curva ROC es una representación gráfica de la proporción de verdaderos positivos versus la proporción de falsos positivos a partir de la predicción que proporciona un determinado método de clasificación. Una de las características más importantes de las curvas ROC es que permiten obtener una medida de la capacidad predictiva del método mediante el cálculo del área bajo la curva.
La estrategia que presentamos, y que hemos implementado en la librería AUCRF en R, se basa en la optimización del área bajo la curva ROC (AUC) del Random Forest. Partiendo de un ranking inicial de variables y mediante un proceso de eliminación, seleccionamos el conjunto de variables que proporciona un mayor AUC. Se trata de un proceso de selección de variables inspirado en el método propuesto por Diaz-Uriarte y Andrés (2006, librería varSelRF). La diferencia principal es que el algoritmo varSelRF selecciona el conjunto de variables con menor error de clasificación. La ventaja de usar el AUC en lugar del error de clasificación como medida de predicción del Random Forest queda especialmente de manifiesto cuando se analizan conjuntos de datos no balanceados. La librería AUCRF proporciona además para cada variable seleccionada una medida de la robustez de dicha selección.
Share: