Sample 7000000224

7000000224: Human tongue dorsum microbial communities from NIH, USA - visit 1, subject 763840445

Overview

Basic Information
IMG/M Taxon OID	7000000224 Open in IMG/M
GOLD Reference (Study \| Sequencing Project \| Analysis Project)	Gs0063646 \| Gp0052742 \| Ga0031241
Sample Name	Human tongue dorsum microbial communities from NIH, USA - visit 1, subject 763840445
Sequencing Status	Permanent Draft
Sequencing Center	Baylor College of Medicine, J. Craig Venter Institute (JCVI), Washington University in St. Louis
Published?	N
Use Policy	Open

Dataset Contents
Total Genome Size	127512101
Sequencing Scaffolds	22
Novel Protein Genes	26
Associated Families	24

Dataset Phylogeny
Taxonomy Groups	Number of Scaffolds
Not Available	1
All Organisms → cellular organisms → Bacteria → Bacteria incertae sedis → Bacteria candidate phyla → Candidatus Saccharibacteria	3
All Organisms → cellular organisms → Bacteria → FCB group → Bacteroidetes/Chlorobi group → Bacteroidetes → Bacteroidia → Bacteroidales → Bacteroidaceae → Bacteroides → Bacteroides thetaiotaomicron	1
All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Clostridia → Eubacteriales → Lachnospiraceae	1
All Organisms → Viruses → Predicted Viral	1
All Organisms → Viruses → Duplodnaviria → Heunggongvirae → Uroviricota → Caudoviricetes → unclassified Caudoviricetes → Siphoviridae sp. ctHip2	1
All Organisms → Viruses → Duplodnaviria → Heunggongvirae → Uroviricota → Caudoviricetes → unclassified Caudoviricetes → Myoviridae sp. ctYA416	3
All Organisms → cellular organisms → Bacteria	3
All Organisms → cellular organisms → Bacteria → FCB group → Bacteroidetes/Chlorobi group → Bacteroidetes → Bacteroidia → Bacteroidales → Porphyromonadaceae → Porphyromonas	2
All Organisms → cellular organisms → Bacteria → FCB group → Bacteroidetes/Chlorobi group → Bacteroidetes → Bacteroidia → Bacteroidales	5
All Organisms → cellular organisms → Bacteria → Bacteria incertae sedis → Bacteria candidate phyla → Candidatus Saccharibacteria → Candidatus Saccharimonia → Candidatus Nanosynbacterales → Candidatus Nanosynbacteraceae → Candidatus Nanosynbacter → unclassified Candidatus Nanosynbacter → Candidatus Nanosynbacter sp. TM7-057	1

Ecosystem and Geography

Ecosystem Assignment (GOLD)
Name	Human Microbial Communities From The National Institute Of Health, Usa, Hmp Production Phase
Type	Host-Associated
Taxonomy	Host-Associated → Human → Digestive System → Oral Cavity → Tongue Dorsum → Human → Human Microbial Communities From The National Institute Of Health, Usa, Hmp Production Phase

Alternative Ecosystem Assignments
Environment Ontology (ENVO)	Unclassified
Earth Microbiome Project Ontology (EMPO)	Host-associated → Animal → Animal surface

Location Information
Location	USA: Maryland: Natonal Institute of Health
Coordinates	Lat. (^o)	39.0042816	Long. (^o)	-77.1012173	Alt. (m)	N/A	Depth (m)	N/A
Location on Map

Zoom:	Powered by OpenStreetMap^©

Associated Families

Family	Category	Number of Sequences	3D Structure?
F028722	Metagenome / Metatranscriptome	190	Y
F033081	Metagenome	178	Y
F040149	Metagenome	162	N
F043235	Metagenome	156	N
F045567	Metagenome	152	N
F046433	Metagenome	151	N
F047508	Metagenome	149	N
F053092	Metagenome	141	N
F054110	Metagenome	140	N
F066860	Metagenome	126	N
F071328	Metagenome	122	N
F077404	Metagenome	117	N
F080166	Metagenome	115	N
F089057	Metagenome	109	N
F092229	Metagenome	107	N
F092230	Metagenome	107	N
F092232	Metagenome	107	N
F099452	Metagenome	103	N
F099453	Metagenome	103	N
F099454	Metagenome	103	N
F103435	Metagenome	101	N
F105376	Metagenome	100	N
F105379	Metagenome	100	N
F105380	Metagenome	100	N

Associated Scaffolds

Scaffold	Taxonomy	Length	IMG/M Link
C3641947	Not Available	519	Open in IMG/M
C3673991	All Organisms → cellular organisms → Bacteria → Bacteria incertae sedis → Bacteria candidate phyla → Candidatus Saccharibacteria	642	Open in IMG/M
C3712625	All Organisms → cellular organisms → Bacteria → FCB group → Bacteroidetes/Chlorobi group → Bacteroidetes → Bacteroidia → Bacteroidales → Bacteroidaceae → Bacteroides → Bacteroides thetaiotaomicron	955	Open in IMG/M
C3718125	All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Clostridia → Eubacteriales → Lachnospiraceae	1035	Open in IMG/M
C3746811	All Organisms → Viruses → Predicted Viral	2043	Open in IMG/M
C3762969	All Organisms → Viruses → Duplodnaviria → Heunggongvirae → Uroviricota → Caudoviricetes → unclassified Caudoviricetes → Siphoviridae sp. ctHip2	7332	Open in IMG/M
C3764837	All Organisms → Viruses → Duplodnaviria → Heunggongvirae → Uroviricota → Caudoviricetes → unclassified Caudoviricetes → Myoviridae sp. ctYA416	28668	Open in IMG/M
SRS014573_WUGC_scaffold_11376	All Organisms → cellular organisms → Bacteria → Bacteria incertae sedis → Bacteria candidate phyla → Candidatus Saccharibacteria	1301	Open in IMG/M
SRS014573_WUGC_scaffold_18709	All Organisms → cellular organisms → Bacteria	13434	Open in IMG/M
SRS014573_WUGC_scaffold_30034	All Organisms → cellular organisms → Bacteria	761	Open in IMG/M
SRS014573_WUGC_scaffold_4353	All Organisms → Viruses → Duplodnaviria → Heunggongvirae → Uroviricota → Caudoviricetes → unclassified Caudoviricetes → Myoviridae sp. ctYA416	67406	Open in IMG/M
SRS014573_WUGC_scaffold_46727	All Organisms → cellular organisms → Bacteria → FCB group → Bacteroidetes/Chlorobi group → Bacteroidetes → Bacteroidia → Bacteroidales → Porphyromonadaceae → Porphyromonas	1166	Open in IMG/M
SRS014573_WUGC_scaffold_48685	All Organisms → cellular organisms → Bacteria → Bacteria incertae sedis → Bacteria candidate phyla → Candidatus Saccharibacteria	1465	Open in IMG/M
SRS014573_WUGC_scaffold_48879	All Organisms → cellular organisms → Bacteria → FCB group → Bacteroidetes/Chlorobi group → Bacteroidetes → Bacteroidia → Bacteroidales	1300	Open in IMG/M
SRS014573_WUGC_scaffold_49562	All Organisms → cellular organisms → Bacteria → FCB group → Bacteroidetes/Chlorobi group → Bacteroidetes → Bacteroidia → Bacteroidales → Porphyromonadaceae → Porphyromonas	701	Open in IMG/M
SRS014573_WUGC_scaffold_49804	All Organisms → cellular organisms → Bacteria	10021	Open in IMG/M
SRS014573_WUGC_scaffold_50780	All Organisms → cellular organisms → Bacteria → FCB group → Bacteroidetes/Chlorobi group → Bacteroidetes → Bacteroidia → Bacteroidales	2813	Open in IMG/M
SRS014573_WUGC_scaffold_55003	All Organisms → cellular organisms → Bacteria → FCB group → Bacteroidetes/Chlorobi group → Bacteroidetes → Bacteroidia → Bacteroidales	1117	Open in IMG/M
SRS014573_WUGC_scaffold_55105	All Organisms → cellular organisms → Bacteria → FCB group → Bacteroidetes/Chlorobi group → Bacteroidetes → Bacteroidia → Bacteroidales	1271	Open in IMG/M
SRS014573_WUGC_scaffold_55379	All Organisms → Viruses → Duplodnaviria → Heunggongvirae → Uroviricota → Caudoviricetes → unclassified Caudoviricetes → Myoviridae sp. ctYA416	50650	Open in IMG/M
SRS014573_WUGC_scaffold_57150	All Organisms → cellular organisms → Bacteria → FCB group → Bacteroidetes/Chlorobi group → Bacteroidetes → Bacteroidia → Bacteroidales	1831	Open in IMG/M
SRS014573_WUGC_scaffold_57180	All Organisms → cellular organisms → Bacteria → Bacteria incertae sedis → Bacteria candidate phyla → Candidatus Saccharibacteria → Candidatus Saccharimonia → Candidatus Nanosynbacterales → Candidatus Nanosynbacteraceae → Candidatus Nanosynbacter → unclassified Candidatus Nanosynbacter → Candidatus Nanosynbacter sp. TM7-057	20962	Open in IMG/M

Sequences

Scaffold ID	Protein ID	Family	Sequence
C3641947	C3641947__gene_144992	F028722	ERHNEIVRNDYNIENQYGPTHKDAISDGDVQGKGTGHGGHTHYLPDCTKPTGMIDYSNFDTEHGGGKYDIEGRNNIGGRNRTLAYSLYNKENMYGQNLIDTKINKEDGQYYVGQTLKRS
C3673991	C3673991__gene_159501	F066860	MTTKKQKLQKQQAIDTWIIIALWVSAIWFSLARGFITGIGGWVLALLAPWALIVSCICLAIISRQVKKRHASKDHLTTIVRVSFIVMSISLFICGLAMPDFSDMETFSTLSVYTNNAISFETSKTIAIISGFVVVLSLFVAVTFGIAEDRE
C3712625	C3712625__gene_178538	F077404	TEAGKSVLHRNAIYIPPALEQYADTALLHQRFNVENKGNYLYTPFTEDNEPTIPFNYGFLHPLGERFYNCFMGKVDRILRPKADKGFIILTSYLVVLGDSYAFDTSNKDTSKLADLKYLDFRHIKRDFSYGHPYQGFTPNDRIELSNFVQSYGRQAALETANAWVMASYPFSLQSTKFENRYTRGRKLILTDGHSTLYLYFLMIDSVAPNFDTEVLPYIKGVFRFNRFR
C3718125	C3718125__gene_181517	F092230	MRQAHKRTVDKLKAYLLKVFFPLFIVCIILVAFFRQIGCGSDGEYAFQISEWGAKLKNIYGTDFINKEIIVRDNAVRVDGIRCLYAVNQNEDGLSIYLLLPGGDYLTHNYVGSSFVRFSNSSEYINMAYGEGSVEVSDSTSTGEAQNTEEKEARDKVDEAINSMRHLFASAIMVNLRVVELYKILTVCMILIVIAMTIGYYSYLKPETVYEFYCKLRRKEKYPSDVNLVKRIGFLVIIL
C3746811	C3746811__gene_199822	F054110	PTIKKLLKALQMNGRRYVVDVRQSWSKYDKPCKVYIVNRMYTEEEYKLTFPHKYKKGKTFKEKQLYKKESEYSSTKQHEVLLFLVRTYKGGD
C3762969	C3762969__gene_217263	F105380	MTIVELDTSQYVKQGRIFKKFESNLLDSYMDGRQTKYNINLADLDDQISDGIVYADKTGKMIYKFSAKKIVQTAITKDLTISGLADEFKMDYYSFWVPDIYLLSYSGFNPGNGLCLAYRKKYEEYICLTNIFPDRREQENSYFPNGKKLETKSICTGSMMADIDSAEYAAWKNDAVTRASQYVNKFLSARGNADLNFVSSSLRSKVPSHDMKKFAEFLGSITKEQENVNTYEEFIEWTKNTKWLK
C3764837	C3764837__gene_221930	F099452	MDKTYEELLQETLSKIYELKDLDNRDRGKALTIFIGERLNRELLLSSRHIFTLYKDIINLDDVSLLTDLRKTDWYKDWFTDDRNNANLINLSRFNFKTLARFEKEEYLRDAEHYDFEGVIEVDSYGLFDTLIEDKDVELFKLAAENILINHGFFHNTDYNFYDVPDEYMEDKEVCAYMCLLNIGNMDFVDKKTLDTTVLYNIVKDRICGSIYFTLFDSLNKDTRTIAR
SRS014573_WUGC_scaffold_11376	SRS014573_WUGC_scaffold_11376__gene_11003	F033081	MHTDITVVYRPKKGVMAWLFRRAMPQDTRPTFVWSRLVTEIENAGYFSRLKFSILAVGLIIMTIATIKMLLFVPGLNQSVVSLLTRGLETFLPAGWAKVTAWVVGTTGVFLIGSFTSSYTPSQRLLYSLEATGCGVYDTLLLLALIEEQAFRSGSERWNWRERVRASVCFGLLHITNIWYSFAAGIALSVTGFGFLLVYLWYYRKYRIQIIATAAAATVHALYNAIAISLIAVVLAIDIAKLL
SRS014573_WUGC_scaffold_18709	SRS014573_WUGC_scaffold_18709__gene_19045	F071328	MSRKHWTFTNIIRYIEEYERNPLLIERMKWKFIPEGECIVEFVELCKHLVLERTIDSKEPLTTAIYLRYSSQLLLKKKRAIRRLGIGKKNVSAILRLCGIHYREYGDDEHRVFFLDTDINIYFCKHYQLPMYIIQRIEFSNKESRPFILKVLPVKRSEW
SRS014573_WUGC_scaffold_30034	SRS014573_WUGC_scaffold_30034__gene_33046	F047508	RAVEAIATDAVLVIEFVGEPIHIGMLGHRLVEGRVKYPYLRRIWEYLRHSFDTEDVGWVVKRSELCALMEHIYYLWGDTYALSKALCTVYEAVTDGVDLIEGLYEVLFFENVEDNLYAACVVRNVKVALDLLSFGIAEGDEGVVDPYALFVPRGQDLVVGELDEGELQGGAATVEDQDFHKVLYYMVRCELILSSP
SRS014573_WUGC_scaffold_4353	SRS014573_WUGC_scaffold_4353__gene_3904	F105379	MVIHFPLSQSDIESLLSISKLLKCDKILYDRNYINPIIGIGPEKSYFQTTSYMVDLSPHINNLLVNISDLKNLGKITQLEPSKDNPEIAIHKPVVSVFNWDAEYVKACMNSLREYQIDDNIITRTDEFHNTDCYNELMAGSASTGAFRINVGGYMIDIPKSAIPTLKSDHVVATVYNAPNKDFNVLRFKITKRNGIVVNQSMLFLPY
SRS014573_WUGC_scaffold_4353	SRS014573_WUGC_scaffold_4353__gene_3924	F092232	MNSQSKFIAEYNDRNRPKFNDRFFCKSDDDIIEDLKDVILSCERNKFYTIKVLGFEVIDDYAEVQKLLIGEETPSISIKDSDLKLLKVTYYVGCTKDEETFDVLIAIPRVIDGAYIHLNGNDYFPLFQLVDGSTYNNTTATSAKTQSITLKTNSNAVKMLRNFVDLNTTKEESIRLAMFSVYLFDHKVTLFEYYLARFGWYDTLEKFNFQDIIRITDYDIDDPEYYTFAIANSHMKSPFYISAVKSFVDNDRILQSFIASFQRAIMLFATKKTTLDQIYTTQFWIQKLGFNFVSSETSTFTKGNAIIESLENSYDIPTKKRLRLPDEIKADIYSVLKWMACEFSSIRLKNNLDASTKRIRWSEYIAAMYIMLINIKLRRLPEKHDPNMEAYRIKQQLNTPPMALIAELQKSNLKGFRNMVNDRDSFLQLKYTIKGPSGPGESNSKNVARNVRAIDPSHLGIIDLNTSSASDPGVGGMLCPLNHGVYEWNSFTNEEEPNVWDDNFSKMLNVYREEKGYTSAIMLAEDAGLELTDTRDPDAVAFDAQLLGQTIAMVARTREFETQLRPALINMEDSCSIYFEEA
SRS014573_WUGC_scaffold_46727	SRS014573_WUGC_scaffold_46727__gene_55813	F099454	MKASKLLWAVVMALTFVLTSCDRLTDEPTLEDRGYYKYFDSTAQHKSFRVVTASGKPYNHKIDWHIIGIRDSKSDTYLTKKVDTLSNGDLKISYDWVSFTVRENKSVIDVEVQENETGKVRAVYLNTNTSGRHITLPDMRVTQRAK
SRS014573_WUGC_scaffold_48685	SRS014573_WUGC_scaffold_48685__gene_58823	F046433	MIELPTSPDALSELSPVAPPKLLSQAQDTSRDNLMVYVKADNYLGTETSDPSFMESRCETTEYEAINDFVQFIEMTERYLPDYMKGCAKELIDELAFLGVPELNFAANALAKRLRHHLEVDNKPVYIDVGNSLSQCRAKNEMKSSQYILSLVLSKFPDDEFEEYEGRLKVYGGRGEIDKSSKILFLDDWIVSGDQVKERIAGFEVDNDPEDHGASVLVMAASGDYLDNGISAYSQYGGTIYPVEACYVLKNSPDAGGMSRVTGIHSSTDNTFGYEVDGIAYCAIERGILKGEGIGELSLPALANIVRPYRNGEDFDGLSRFRQLLERE
SRS014573_WUGC_scaffold_48879	SRS014573_WUGC_scaffold_48879__gene_59136	F040149	VADEGAEELRWEVLIEEQGIPVLFVEVVAWYDGRVSSSEILRSVGVALEREPWLAPVWSHDSEDAIHDFIYDTSVPKGHTLTAVRERETVV
SRS014573_WUGC_scaffold_49562	SRS014573_WUGC_scaffold_49562__gene_60250	F099454	GIKTLMKAYKLLWAVVMALTFVLTSCDRVTDEPTIEGKMNKFFDSQAQRKSFRVLTASGKPYNHKIDWHIIGILDPKSETYLTKKVDTLSNGDLKISYDWVAFIVRENKSVIDVEVQNNETGQDRSVDFVAQDNHKGLASPSMTVIQRAK
SRS014573_WUGC_scaffold_49804	SRS014573_WUGC_scaffold_49804__gene_60670	F089057	MTNIIPIIAKKYNRKGDTSGSLKSLVSDLNCIDNVDDSLLFLSSIPRETKYTLDEVFDIITSDDIYIKIFGNVLTFLNMDLDYHRLLLNAIKSESYKIISIINESIPTPDLFLAKNNYECLSVALDKPFVIFDKILGMVVSQLLHTASSKEERIFGIFMTICIINREINKLASLCTGYLAITRDEVLVKDLMNESAMVAFQYMSTEDINNVVSDINSRTVLSRYLSNM
SRS014573_WUGC_scaffold_50780	SRS014573_WUGC_scaffold_50780__gene_62313	F077404	SGTLPKGTYSDWKYKNPFAMNILKTAFAFFFALCFMMGANSYAQKTESINAEASKNELKRNAVYLPPALEEYADTTLLHQRFIVENKGNYLYIPFTEDNEPTIPFNYGFLHPLGERFYNCFMGKVDRILRPKEDKGFIILTNYLVVLDDKYAFDTSNKDTSKLADLKYLDFRHIKRDFSYGHPYQGFTAYDRVELSNFVQSYGRQAALETANAWVMAGYPFSLQSTKFENLYTRGRKLILTDGKTTLYLYFLMTDSVALNFDTEVLPYIKGVFRFNRIQ
SRS014573_WUGC_scaffold_55003	SRS014573_WUGC_scaffold_55003__gene_70931	F045567	VHTSTHRVEDALLAVDGDILTPRDGTHIVQTERVVVVLVSQEDRIDTIDTETCGLVVEVRATVDEDTLPTLGDDEGRGAQTTVTSIRAMAHRAATAYLGDTSAGARTEKNYLHVSRRESYHGKEKPHLTEREGAW
SRS014573_WUGC_scaffold_55105	SRS014573_WUGC_scaffold_55105__gene_71250	F043235	MDEVVPSDEGHLLIDLCDDDPRSLCGGLGIVTRYPEGAIALFIGLAHRDQCDIDRIDTIPKEVWEFMEVTREIVDTLIQVSGAAILVKEVKDGMYMPHHLWAEVPRLGKVQHVEGFHVREALAIIVEGFGETAGGCHSMAKDQEVPALYCRSHGFEGGRSMA
SRS014573_WUGC_scaffold_55379	SRS014573_WUGC_scaffold_55379__gene_71921	F080166	MEVTFNGILKRLGNDVRENFHTEYIVNSGSLTTNVKYRYRMKLSPKGEQTCVYIDWDNYDDLFNVLEESIKICDPENPRTPFKRTYSDKGDLLDIRCNSLQVKYQHLNDRFGNTIDLIPFVLVDEQSGLLTEAIRFRFNNELVYDVPISRLKGFRRFLMTYNPLLHAGAMARYMAMTPLLGSNRQNMMRS
SRS014573_WUGC_scaffold_55379	SRS014573_WUGC_scaffold_55379__gene_71923	F099453	MNRFDIIELAQQTITFVHSAFNGKVNALDPYTRLNFVSGYLDKKTNIARTTPYGCIYVSLEAFADTVEAYKFIDTDQIRNLALEIIIHELTHVDQLIDYRYIKFNNGYREEIERQCVKQSCQWILDNIQFIRSLGLVVIPEVYEERLVGLSDVTYAFKNPAVIAMSKLEHMIGKKFKEFNSNDIEIVYVDRLKNYYKIPVCINRMYHNSQNLNDLGERLLNDKQYTIEYMEYGNSKLVIKITQGA
SRS014573_WUGC_scaffold_55379	SRS014573_WUGC_scaffold_55379__gene_71945	F092229	MSENYRFDHIPEVVLRNVKFIRENNIDIGTGDDVLDCMMEINPVLRQRIYDDYDLAKDVAERRFRSTIEELDLATVLQKCTTRPYIAILNNIFFRYFNSKLIDDMFKLGESTKVLDLAIEYECEYYTINSAKTNIRRYMQQAYFDKYAADSNIISSHRVLNDPQVNAVKSAEFTYDLFTAARSEKFNPEMVRDIFLKYGLKTNSSRNLYTRMNNNLSLYYYMEDYLTEYMLKGSFTYGSQVYSTIKEFKCLPLMNVLTQLTRHNPSGYVLDSNLELVKG
SRS014573_WUGC_scaffold_57150	SRS014573_WUGC_scaffold_57150__gene_77907	F053092	MQSDQGLILCLTHALLVLGALILEPAEMEDTMDDHTVQLFGILIAKELGIATHRIKADEHVPRDHIPLTLVEGDDIGIVVMIEKVLIGLQDALITTELVAELADTTVIASSDLTDPVAKDTLSEARLLDVFVSIVSYKLRFFRHK
SRS014573_WUGC_scaffold_57180	SRS014573_WUGC_scaffold_57180__gene_78025	F105376	MNEKPEVSAKEFGALQAKVEYIKDGVDKHTVMLERIENIARDNVTQAQLKTYIAEHEKESEEKYVKRTEIEGVMNFWKLVTSNLAKLFAIALVGLAIYATNNLIQQNKAVTELKEEVQQTQVRRK
SRS014573_WUGC_scaffold_57675	SRS014573_WUGC_scaffold_57675__gene_81255	F103435	MKFVFCTEPIYQYYRAHLYDADKDKLDKQLLVEYGDYKDIWDLKQQQDALPENIFKAELTSRDYPRNPWNYVSQLINKLTYQYLIDSPDFEDIFSEILFNQSEREFYEFYKAIDRFYNGSEIFITVANDDYSDMVTQMVCSVLRRTYGIRPQIIYDIDDVHSIRDDIDFSPEGAQIAYLQRHTYLALESKSTIEPLRVWYPFDMNSYTNALE

Bioinformatics & Integrated Biology Lab
Institute for Fundamental Biomedical Research
Biomedical Sciences Research Center "Alexander Fleming"

NMPFamsDB

NMPFamsDB

NMPFamsDB

A database of Novel Metagenome Protein Families

A database of Novel Metagenome Protein Clusters

A database of Novel Metagenome Protein Clusters

7000000224: Human tongue dorsum microbial communities from NIH, USA - visit 1, subject 763840445

Overview

Ecosystem and Geography

Associated Families

Associated Scaffolds

Sequences