Cáncer de centro de datos de genómica agrega el cáncer infantil

Mayo 28, 2016 Admin Salud 0 2
FONT SIZE:
fontsize_dec
fontsize_inc

Los investigadores que estudian la genética del cáncer infantil tienen ahora acceso a un conjunto grande y creciente de datos genómicos a través del Hub de Genómica del Cáncer (CGHub), dirigido por la Universidad de California, Santa Cruz. Los datos provienen de una iniciativa del Instituto Nacional del Cáncer (NCI) llamada META (Therapeutic Research Aplicable para generar tratamientos efectivos), que tiene como objetivo determinar los cambios moleculares que impulsan el desarrollo y progresión de los cinco tipos principales de cáncer infantil.

Un equipo dirigido por UCSC bioinformática experto David Haussler CGHub estableció en 2012 para gestionar los datos de la secuencia primaria de todos los programas de investigación de genómica del cáncer del NSC. Estos programas, que tienen como objetivo mejorar el tratamiento del cáncer mediante la identificación de los conductores genéticas del cáncer, requieren enormes cantidades de datos que debe ser compartida entre los investigadores de todo el país. Las muestras de tejido de miles de pacientes con cáncer son enviados a centros de secuenciación para el análisis, la producción de archivos de gran tamaño que pueden ascender a más de 400 gigabytes (GB) por paciente. Los centros de secuenciación subir archivos CGHub, donde se valida la información, organizada, almacenada y disponible para su descarga por los investigadores.

Los investigadores del cáncer utilizando CGHub se excitan su desempeño, dijo Haussler, un distinguido profesor de ingeniería biomolecular en la UCSC Baskin Escuela de Ingeniería. "Realmente proporcionar mayor, los datos más extensa establece de manera más eficiente que en el pasado", dijo. "Estoy muy orgulloso del equipo, y es una inspiración para todos nosotros para ayudar con este esfuerzo, sobre todo ahora con la incorporación de los datos de cáncer infantil."




En los últimos meses, las descargas desde CGHub superaron 1.000 terabytes (1.000.000 GB) al mes. Gad Getz, quien encabeza el análisis del genoma del cáncer en el Instituto Broad de Harvard y el MIT, dijo Haussler fue capaz de descargar los datos de CGHub a un ritmo impresionante de cuatro terabytes por hora.

El director técnico Marcos CGHub Diekhans dijo que es importante que los investigadores tienen fácil acceso a estos grandes conjuntos de datos. "El acceso a los datos no debe ser una barrera a la investigación. Hacer fácil requiere no sólo la infraestructura adecuada y un buen software, pero también un buen apoyo a los usuarios", dijo.

CGHub es un repositorio seguro construido con una capacidad de almacenamiento previsto 5 petabytes (5.000 terabytes). Uso de software GeneTorrent, desarrollado por Sistemas Annai, para permitir las transferencias de datos rápidas escala terabyte. CGHub Personal construyó un "Explorador de datos" especializado, que permite a los investigadores para encontrar fácilmente y descargar archivos de secuencias que necesitan.

Los primeros datos provenía del programa cargado CGHub del Genoma del Cáncer Atlas (TCGA), que está equipado con más de 25 tipos y subtipos principales de los adultos con cáncer. Liderados por el NCI y el Instituto Nacional de Investigación del Genoma Humano, TCGA hasta ahora ha producido cerca de 500 terabytes de datos genómica que los investigadores ahora pueden acceder a través CGHub. El año pasado, TCGA ha producido una serie de publicaciones histórico que da a los científicos una nueva comprensión de algunos tipos principales de cáncer, incluyendo cáncer de mama, cáncer de ovario, cáncer colorrectal, y más recientemente, la cáncer endometrial y la leucemia mieloide aguda. Estos estudios revelaron cambios genéticos comunes entre los diferentes tipos de cáncer y sugieren nuevas formas de clasificar los tumores en subtipos que pueden ser objeto de tratamientos diferentes.

El programa META promete ofrecer puntos de vista similares en los tumores de los niños. Alrededor de 400 terabytes de datos de destino se pusieron a disposición en CGHub.

Según Haussler, los cambios genéticos en los tumores de los niños tienden a ser menos complejos que los de cáncer en adultos, lo que puede hacer que sea más fácil de entender cómo estos cambios conducen a cáncer. "Podemos ser capaces de decodificar los tumores de los niños antes de cánceres en adultos, pero todavía tenemos una enorme cantidad de datos para entender esto. Nuestro objetivo con CGHub es tener toda esta información a la mano para los investigadores ", dijo.

Una parte importante del trabajo implica CGHub garantizar la compatibilidad de los datos de diferentes centros de secuenciación. Centros han utilizado diversos métodos para identificar las mutaciones en las secuencias del genoma, por lo que los científicos han diseñado ejercicios de referencia y validación CGHub para mejorar el acuerdo entre los diferentes métodos.

"Hemos hecho un montón de trabajo para mejorar la precisión del diagnóstico de mutaciones en los tumores", dijo Haussler. "Este es un preludio esencial a lo que muchos creen será una práctica común en la medicina del cáncer. Sabiendo donde las mutaciones son y cómo funcionan es la clave para tener la medicina de precisión para el cáncer. Si somos capaces de construir estas herramientas y demostrar su utilidad, esperamos que un día va a ser una parte rutinaria de la atención del cáncer para que su tumor secuenciado para que el médico sepa exactamente qué mutaciones son y qué tratamientos serán más eficaces ".

Además TCGA y TARGET, los datos de la Iniciativa Genoma del Cáncer Caracterización (CGCI), que se centra en varios tipos de cáncer en niños y adultos, estarán disponibles a partir de mediados de 2014. CGHub El acceso a todas estas series de datos se limita a investigadores aprobados por los Institutos Nacionales de Salud.

Hay, sin embargo, una serie de datos sobre CGHub que está disponible para el acceso público. Esta es la línea celular de cáncer Encyclopedia (CCLE), que proporciona datos genómicos por cerca de 1.000 líneas celulares que se utilizan ampliamente en los laboratorios de investigación. El proyecto CCLE es una colaboración entre el Instituto Broad y los Institutos Novartis para la Investigación Biomédica, parcialmente financiado por el Instituto Nacional del Cáncer a través de TCGA.

"Estos genomas de líneas celulares que no están asociados con una persona en particular, por lo que no hay problemas de privacidad en hacerlos accesibles al público", dijo Linda Rosewood, director del programa CGHub. "Este conjunto de datos es muy importante como herramienta de investigación, pero también puede ser una valiosa herramienta de enseñanza que los estudiantes pueden utilizar para conocer la bioinformática y la genómica del cáncer."

(0)
(0)

Comentarios - 0

Sin comentarios

Añadir un comentario

smile smile smile smile smile smile smile smile
smile smile smile smile smile smile smile smile
smile smile smile smile smile smile smile smile
smile smile smile smile
Caracteres a la izquierda: 3000
captcha