Il sito si sposta…

Volendo un po’ più di libertà mi sono spostato e ho aperto un nuovo blog con una piattaforma WordPress.org.

Curiosito

Gli articoli di questo blog verranno gradualmente spostati…

Ci scusiamo per il disagio 😀 !

Database Vettori

Dove cercate le mappe dei vostri vettori? Su Google? Su Pubmed?

Io mi sono trovato molto bene con questo Database di Vettori gestito da AddGene.

Fornisce molte informazioni sui plasmidi: sequenza, mappa, enzimi di restizione, proteine tradotte. Si possono depositare (gratuitamente) i plasmidi che sono stati utilizzati (ad esempio) in un lavoro, e questi possono essere acquistati da altri ricercatori.

Addgene è un organizzazione no profit, ovviamente i guadagni vengono usati per mantenere il servizio. Insomma…è una sorta di banca/database di vettori per aiutare i Ricercatori….

Disegnare velocemente Primer con CLC…

A seconda del tipo di PCR che si deve fare (Real Time Pcr o no, da genomico o da plasmide) si devono costruire primer più o meno “accurati”. Se si deve fare una Pcr da genomico ad esempio bisogna stare attenti che i primer non vadano anche ad annilare in altri punti del genoma, oltre a quello di interesse…

Nel mio caso faccio molte PCR da plasmidi. In questo caso le coppie di basi non sono molte, quindi è altamente improbabile che primer lunghi 15-20 nucleotidi vadano ad annilare in più punti.

In questo caso disegnare dei primer è molto semplice…Ma troppe volte vedo persone che disegnano su carta i primer, sia forward che reverse (perdendo tempo e rischiando di fare errori).

La cosa è molto più semplice con CLC Sequence Viewer:

  • (Ovviamente) Importare la sequenza del gene su cui fare la PCR in CLC Sequence Viewer
  • Selezionare lo spaziamento ogni 3 nucleotidi scegliendo il frame appropiato (Potete anche salvare questa opzione in modo da non selezionarla ogni volta).

schermata-clc-sequence-viewer-save-setting1

  • Selezionare i 15-20 nucleotidi che formeranno il primer FW (tenendo conto del frame e che devono terminare con una C o G), poi tasto dx -> Open Selection in new view
  • Tasto dx sul primer appena creato -> Select Sequence, di nuovo tasto dx -> Edit. In questo modo potete modificare la sequenza, aggiungere codoni di start, enzimi di restrizione.
  • Tornando sulla sequenza del gene selezionate il segmento che andrà a formare il primer Reverse. In questo caso non c’è bisogno di tenere conto del frame. Fate in modo che cominci con una G o una C (l’inizio che selezionate diventerà il 3′, quindi rappresenta la fine del primer). Al solito, fate tasto dx -> Open Selection in new view. Poi modificate il primer a vostro piacere aggiungendo codone di STOP o siti di restrizione.
  • A questo punto nella toolbox “Reverse Complemente Sequence” e avrete il vostro primer Reverse pronto.

schermata-clc-sequence-viewer-toolbox

I primer possono essere copiati-incollati sul sito dove ordinate i primer (evitate errori di battitura), possono essere stampati o salvati in una cartella. Vi ricordo che se si deve fare una Pcr da genomico bisogna stare attenti che i primer non vadano anche ad annilare in altri punti del genoma, quindi questo metodo non va bene.

Spero però sia utile a qualcuno!!

Alla prossima…

Formati Sequenze

I Flat File sono dei semplici file di testo, molto usati nei database, che contengono (ovviamente) dati 😀 .
Un tipo di Flat File è il Formato Fasta.

FASTA Format
Presenta la riga iniziale che comincia con un “>”, a cui fa seguito un identificativo unico, seguito da una opzionale corta definizione. Le linee a seguire contengono la sequenza amminoacidica o nucleotidica
Quando si visualizzano queste sequenze con un editor di testo (Tipo OpenOffice Writer, Word, ecc) è consigliabile usare un tipo di carattere (come Courier) che dà una larghezza uguale ad ogni lettera.
Perchè?! Ecco la differenza:

schermata-senza-nome-1-openofficeorg-writer1

Molto meglio visualizzarle con un editor di testo.

Un altro tipo di Flat File è Formato RAW, che è praticamente la sequenza del FASTA senza la prima riga iniziale.
Alcuni tool bioinformatici richiedono il Formato FASTA per le sequenze, altri il formato RAW.

EDIT: ho provveduto a modificare il titolo dell’articolo, perchè l’altro non c’azzeccava niente 😀 !

Scaricare articoli da casa

Capita di stare a casa, e di dover scaricare un articolo da PubMed…spessissimo però c’è bisogno di un abbonamento alla rivista per poter scaricare il giornale. Le università hanno questi abbonamenti, per cui l’articolo può essere scaricato da un computer dell’università…ma non da casa.

Molte università danno la possibilità di scaricare gli articoli da casa utilizzando un programma proxy. Senza entrare in inutili termini informatici…il proxy è un programma che (nel nostro caso) fa sembrare il pc di casa un pc dell’università.

Vediamo un po’ come fare:

Per prima cosa dovete controllare se la vostra università vi permette di accedere via proxy (altrimenti inutile continuare), per controllare cercate sul sito della vostra università, o chiedete a San Google 😀 . L’università che frequento io (Federico II di Napoli) ha introdotto questa possibilità nel 2004. Dovreste trovare anche le informazioni per usare il proxy, cioè l’indirizzo e la porta del proxy, l’username e la password (di solito si richiede la registrazione ad un servizio/mail della facoltà). Ora, se non l’avete ancora fatto, scaricate Firefox, che è un programma per navigare su internet…simile a Internet Explorer…ma molto meglio 😀 . Firefox permette di essere personalizzato grazie a tanti piccoli programmi aggiuntivi, chiamati “componenti aggiuntivi”, “estensioni” o “add-on”. Nel nostro caso è molto utile un’estensione chiamata FoxyProxy, che permette velocemente di impostare, attivare e disattivare il Proxy. Installatela.

Al primo avvio vi verrà chiesto se volete usare un proxy Tor. A noi non interessa, quindi cliccate no.

Ora andate in Strumenti -> FoxyProxy -> Generali. Cliccate su nuovo proxy, inserite un nome e una eventuale nota. Andate sulla scheda dettagli dei proxy

schermata-foxyproxy-impostazioni-dei-proxy

Inserite come nome del server l’indirizzo del proxy della vostra università (nel mio caso proxy.unina.it), il numero della porta (nel mio caso 3128) e date ok. Ora, andando di nuovo su Strumenti -> FoxyProxy potrete scegliere il Proxy della vostra università. A questo punto potete inserire username e password (nel caso della mia università, compreso di @studenti.unina.it). Ora potete andare su PubMed e scaricare tutti gli articoli che volete (ammesso che la vostra università abbia i rispettivi abbonamenti).

Se volete potete aggiungere nei commenti un link alla pagina della vostra università in modo da avere tutte le informazioni raccolte in un unico sito.

Un’ultima cosa: usare un programma Proxy rallenta di molto la velocità di navigazione sul web, per cui usate il proxy solo quando serve.

Alla prossima…

Editor di sequenze: CLC Sequence Viewer

Un editor di sequenze è un programma in grado di manipolare con facilità sequenze nucleotidiche e proteiche. Il primo dei programmi che ho intenzione di presentarvi è CLC Sequence Viewer che è arrivato alla versione 5.1.1

Il programma è creato dalla CLC bio, che permette il download e l’utilizzo gratis, indubbiamente presenta una grafica molto curata, ed una facilità d’uso impressionante, adatto anche a chi non sa bene usare il computer.
Questo programma presenta tante limitazioni rispetto agli altri programmi (a pagamento) della CLC bio.
Le operazioni possibili sono (e le limitazioni relative sono):

  • effettuare ricerche direttamente su NCBI, anche se a causa delle limitazioni non è possibile effettuare ricerche su altri database, bisogna comprare le altre versioni.
  • creare allineamenti multipli e relativi alberi, con vari algoritmi: Clustal, T-coffe, ecc…
  • varie operazioni con i nucleotidi: convertire Dna ↔ Rna, vedere filamento complementare di una sequenza, tradurla in proteina, Cercare ORF, ecc…
  • Cercare enzimi di restrizione presenti in una sequenza ed elencarli in una lista.

Quando si effettua una ricerca su NCBI, o si importa una sequenza, CLC Sequence Viewer è in grado di leggere le annotazioni e visualizzarle graficamente, indicando ad esempio promotori, la sequenza codificante in un cDna, domini e così via…Una grossa limitazione che ho trovato è non poter modificare le annotazioni riguardanti le sequenze. Quindi non è possibile selezionare una serie di nucleotidi/amminoacidi e aggiungere un’annotazione ad esse (ad es. questo è un promotore, qui c’è un sito di fosforilazione, ecc). Questa forte limitazione (e il fatto che secondo me i programmi dovrebbero essere liberi) mi ha spinto a cercare un altro editor di testo.

Qui è presente l’elenco completo delle limitazioni, paragonate ai relativi software a pagamento.

Il programma è disponibile per Windows, Mac, Linux (sia file .rpm che .sh), ed è molto semplice da installare. Nel caso del file .sh per le distribuzioni Linux (tipo Ubuntu) basta fare tasto dx, proprietà -> permessi e spuntare la voce: “Consentire l’esecuzione del file come programma”. Fare doppio clic sul file .sh e cliccare su “Esegui” per avviare l’installazione.

Database di cellule staminali

A proposito di database…

Da poco la University of Massachusetts Medical School ha messo online uno dei più completi database sulle cellule staminali: l’ “International Stem Cell Registry“, con indicate una quantità di informazioni che potrebbero essere veramente utili a chi ci lavora: marker presenti, referenze, dove reperirle, tipizzazione HLA…

Qui l’elenco delle linee cellulari presenti.

Fonte: BiotecnologieMediche.it

Avere gli amminoacidi sott’occhio

Nel laboratorio dove lavoro tratto principalmente proteine. Per questo trovo molto conveniente avere sotto mano (anzi sott’occhio) gli amminoacidi. Per avere una chiara idea degli amminoacidi, o trovato interessante suddividerli in gruppi omogenei, ed è uscita così una Tavola degli amminoacidi simile alla Tavola periodica degli elementi, da poter stampare e appendere al muro. Ci sono anche elencate altre caratteristiche, tipo Peso Molecolare, idrofobicità, Punto isoelettrico e così via…

Versione in inglese

Recentemente mi sono trovato sul sito di Wikipedia, e ho trovato un’altra comoda rappresentazione degli amminoacidi, dove sono indicate altre caratteristiche, come: formula di struttura, modificazioni post-traduzionali, codone codificante, ecc… Ho dovuto cambiare la versione originale del file, perchè c’erano degli errori nei codoni codificanti. Ora dovrebbe essere tutto a posto. Ho provveduto anche a inserire la versione corretta su Wikipedia. Ho preparato un file pdf da stampare per voi…

Codice Genetico - Pdf

Amminoacidi.pdf

Spero serva…

Banche Dati

UPDATE 22/08/08

Esistono 2 grandi laboratori internazionali di bioinformatica l’EMBL-EBI (Europeo) e l’NCBI (Americano). Questi due centri hanno dato vita a vari progetti e banche dati (database). Dalloliogm mi segnala (grazie!) anche Genome.jp, un altro laboratorio internazionale di bioinformatica (Giapponese), che fornisce database interessanti.

Le banche dati sono dei grandi archivi riguardanti un determinato argomento, ovviamente nel nostro caso riguardano argomenti biologici. Le banche dati oggi esistenti (in campo biologico) saranno un migliaio, e viene catalogato praticamente di tutto, dal genoma umano alle malattie, passando per geni, Rna, polimorfismi e chi più ne ha più ne metta.

Alcune di queste banche dati sono state sviluppate dall’EMBL-EBI, altre dall’NCBI, contengono milioni di voci, e sono utilissime. Le banche dati possono essere mantenute e controllate da persone, queste di solito risultano molto ben curate e poco ridondanti. Altre invece possono essere mantenute da software, quindi sono aggiornate molto velocemente ma molto ridondanti (per ridondante si intende che la stessa informazione è contenuta più volte)

Esistono 3 banche dati che sono dette primarie, poichè contengono le informazioni riguardanti il Dna. Tutte le altre banche dati (proteiche, di polimorfismi, di malattie) sono collegate a queste. Due di queste sono EMBL datalibrary e la GenBank. Fra queste due banche dati c’è un continuo scambio di dati, per cui tutte le informazioni che potete trovare su una, le trovate anche sull’altra.

Esistono poi database secondari, che contengono sequenze proteiche: Swiss-prot, TrEMBL e PIR. Swiss-prot è curata manualmente, per cui è poco ridondante ed è ricca di informazioni (ed è un database che adoro!!! 😀 ). TrEMBL nasce grazie alla traduzione automatica dei geni presenti in EMBL datalibrary, per cui alcune delle proteine predette possono non esistere nella realtà. PIR è l’equivalente nato dal laboratorio americano. Nel 2002 nasce un database integrato fra Swiss-prot, TrEMBL e PIR chiamato UniProt.

Allo stesso di UniProt, varie banche dati riguardanti famiglie proteiche, domini proteici, motivi sono state raccolte in InterPro. In particolare Pfam (famiglie e domini proteici), PRINTS (motivi proteici), PROSITE (famiglie, domini e motivi proteici curati dagli stessi di Swiss-prot).

Infine esistono banche dati delle strutture tridimensionali delle proteine come PDB, le cui coordinate di tutti gli atomi di una proteina sono ricavate sperimentalmente, oppure come ModBase invece, le cui strutture tridimensionali sono solo previsioni…ma possono essere utili lo stesso…

Fra i progetti avviati da Genome.jp c’è KEGG, un insieme di Database riguardanti genomi e pathway enzimatici. Fra questi database indico appunto KEGG Pathway, un database di tutte le vie metaboliche della cellula.

Spero di riuscire ad entrare nel dettaglio di tutti questi database…

Infine ho per voi un’immagine riassuntiva di tutti i database:

Bè…se ho sbagliato qualcosa segnalatemelo! Se avete voglia di aggiungere qualcosa…fatelo! 😀

Alla prossima…

MyBioinformatica

MyBioinformatica è un blog che tratta dell’uso dell’informatica nel campo della Biologia…

Non mi sento pienamente padrone di questa materia…anche se mi affascina e interessa moltissimo. Con questo blog cerco di ordinare, fissare e appuntare le mie conoscenze, e di condividerle con gli altri. Se anche voi sapete poco di bioinformatica, questo blog potrebbe esservi utile per fare un po’ di chiarezza…Se invece siete esperti in questa materia, bè, seguite il blog e datemi consigli/correzioni…ve ne sarei grato.

Non so ogni quanto riesco a pubblicare un articolo, e suppongo ci saranno periodi di vuoto, per questo vi consiglo di iscrivervi o alla newsletter o ai Feed per seguire il blog.

Bè…si comincia… 😀 !!!