#!/usr/bin/env python3
# -*- coding: utf-8 -*-
"""
Toy proram to experiment with genomes

@author: rodri
"""
#%% EXPLORANDO EL GENOMA DE E COLI
ecoli=open("E-coli.txt").readlines() #leemos un genoma (ojo con la ruta!)
ecoli=ecoli[0].upper()               #lo ponemos en mayúsculas
print("La longitud del genoma es", len(ecoli))   #len() da la longitud
print("La secuencia de la posicion 10 a la 49 es:", ecoli[10:50])
print("El contenido de G es", ecoli.count("G")) #count() cuenta coincidencias
#%%
#Cuántas Aes hay en E coli?

#Alguna vez ocurren 8 Gs seguidas?

#Y cuál es el contenido en GC?

#Podrías dar esos valores en porcentaje?

#%% EXPLORANDO EL GENOMA DEL P FALCIPARUM
pf=open("Plasmodium_falciparum.fa").readlines()    #Esto no es un .txt?
print("las primeras líneas leidas son\n", pf[:10]) #Ups, no tan fácil de leer!
dna=""                       #Vamos a arreglarlo y ponerlo en la variable dna
for linea in pf:
    if(linea.startswith(">")==False): #Si la línea no comienza por ">"
        linea.replace("\n", "")       #Eliminamos ese \n final
        dna+=linea                    #Añadimos la línea a su genoma
print("La longitud del genoma es", len(dna))   #len() da la longitud
print("El contenido de G es", ecoli.count("G")) #count() cuenta coincidencias
#%%
#¿Son distintos los contenidos en GC de E coli y P falciparum?