Sample 3300008362

3300008362: Human tongue dorsum microbial communities from NIH, USA - visit 1, subject 160400887 reassembly

Overview

Basic Information
IMG/M Taxon OID	3300008362 Open in IMG/M
GOLD Reference (Study \| Sequencing Project \| Analysis Project)	Gs0063646 \| Gp0053223 \| Ga0115107
Sample Name	Human tongue dorsum microbial communities from NIH, USA - visit 1, subject 160400887 reassembly
Sequencing Status	Permanent Draft
Sequencing Center	Baylor College of Medicine, J. Craig Venter Institute (JCVI), Washington University in St. Louis
Published?	N
Use Policy	Open

Dataset Contents
Total Genome Size	128921695
Sequencing Scaffolds	16
Novel Protein Genes	26
Associated Families	22

Dataset Phylogeny
Taxonomy Groups	Number of Scaffolds
All Organisms → Viruses → Duplodnaviria → Heunggongvirae → Uroviricota → Caudoviricetes → Caudovirales	1
All Organisms → cellular organisms → Bacteria → Proteobacteria → Betaproteobacteria → Neisseriales → Neisseriaceae → Neisseria → Neisseria mucosa	1
All Organisms → Viruses → Duplodnaviria → Heunggongvirae → Uroviricota → Caudoviricetes	3
All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Negativicutes → Veillonellales → Veillonellaceae → Veillonella → Veillonella tobetsuensis	1
All Organisms → cellular organisms → Bacteria	2
All Organisms → cellular organisms → Bacteria → Bacteria incertae sedis → Bacteria candidate phyla → Candidatus Saccharibacteria → Candidatus Saccharimonas → Candidatus Saccharimonas aalborgensis	2
Not Available	2
All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Clostridia → Eubacteriales → Lachnospiraceae	1
All Organisms → cellular organisms → Bacteria → Bacteria incertae sedis → Bacteria candidate phyla → Candidatus Saccharibacteria	2
All Organisms → Viruses → Predicted Viral	1

Ecosystem and Geography

Ecosystem Assignment (GOLD)
Name	Human Microbial Communities From The National Institute Of Health, Usa, Hmp Production Phase
Type	Host-Associated
Taxonomy	Host-Associated → Human → Digestive System → Oral Cavity → Tongue Dorsum → Human → Human Microbial Communities From The National Institute Of Health, Usa, Hmp Production Phase

Alternative Ecosystem Assignments
Environment Ontology (ENVO)	Unclassified
Earth Microbiome Project Ontology (EMPO)	Host-associated → Animal → Animal surface

Location Information
Location	National Institutes of Health, USA
Coordinates	Lat. (^o)	N/A	Long. (^o)	N/A	Alt. (m)	N/A	Depth (m)	N/A
Location on Map

Zoom:	Powered by OpenStreetMap^©

Associated Families

Family	Category	Number of Sequences	3D Structure?
F018385	Metagenome	235	Y
F032313	Metagenome	180	N
F046433	Metagenome	151	N
F054110	Metagenome	140	N
F066860	Metagenome	126	N
F074985	Metagenome	119	N
F078842	Metagenome	116	N
F080166	Metagenome	115	N
F081455	Metagenome	114	N
F081510	Metagenome	114	N
F089057	Metagenome	109	N
F092229	Metagenome	107	N
F092230	Metagenome	107	N
F092232	Metagenome	107	N
F095629	Metagenome	105	N
F095631	Metagenome	105	N
F095633	Metagenome	105	N
F099452	Metagenome	103	N
F099453	Metagenome	103	N
F103431	Metagenome	101	N
F103433	Metagenome	101	N
F105379	Metagenome	100	N

Associated Scaffolds

Scaffold	Taxonomy	Length	IMG/M Link
Ga0115107_100006	All Organisms → Viruses → Duplodnaviria → Heunggongvirae → Uroviricota → Caudoviricetes → Caudovirales	236647	Open in IMG/M
Ga0115107_100009	All Organisms → cellular organisms → Bacteria → Proteobacteria → Betaproteobacteria → Neisseriales → Neisseriaceae → Neisseria → Neisseria mucosa	180404	Open in IMG/M
Ga0115107_100107	All Organisms → Viruses → Duplodnaviria → Heunggongvirae → Uroviricota → Caudoviricetes	56959	Open in IMG/M
Ga0115107_100223	All Organisms → Viruses → Duplodnaviria → Heunggongvirae → Uroviricota → Caudoviricetes	38708	Open in IMG/M
Ga0115107_100279	All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Negativicutes → Veillonellales → Veillonellaceae → Veillonella → Veillonella tobetsuensis	34230	Open in IMG/M
Ga0115107_100437	All Organisms → cellular organisms → Bacteria	26568	Open in IMG/M
Ga0115107_101220	All Organisms → cellular organisms → Bacteria → Bacteria incertae sedis → Bacteria candidate phyla → Candidatus Saccharibacteria → Candidatus Saccharimonas → Candidatus Saccharimonas aalborgensis	13529	Open in IMG/M
Ga0115107_101875	All Organisms → cellular organisms → Bacteria → Bacteria incertae sedis → Bacteria candidate phyla → Candidatus Saccharibacteria → Candidatus Saccharimonas → Candidatus Saccharimonas aalborgensis	9999	Open in IMG/M
Ga0115107_103649	All Organisms → cellular organisms → Bacteria	5699	Open in IMG/M
Ga0115107_104032	Not Available	5190	Open in IMG/M
Ga0115107_104138	All Organisms → Viruses → Duplodnaviria → Heunggongvirae → Uroviricota → Caudoviricetes	5086	Open in IMG/M
Ga0115107_104348	All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Clostridia → Eubacteriales → Lachnospiraceae	4854	Open in IMG/M
Ga0115107_106958	Not Available	3100	Open in IMG/M
Ga0115107_107764	All Organisms → cellular organisms → Bacteria → Bacteria incertae sedis → Bacteria candidate phyla → Candidatus Saccharibacteria	2768	Open in IMG/M
Ga0115107_110917	All Organisms → cellular organisms → Bacteria → Bacteria incertae sedis → Bacteria candidate phyla → Candidatus Saccharibacteria	1949	Open in IMG/M
Ga0115107_113793	All Organisms → Viruses → Predicted Viral	1539	Open in IMG/M

Sequences

Scaffold ID	Protein ID	Family	Sequence
Ga0115107_100006	Ga0115107_100006115	F092232	MNTQAKFIADYNDKNRPKFNDKFFTKSDDDIIEDLKDVILSCERNKFYTIKVLGFEVIDDYTEVQKLLIGDETPSISIKDSDLKILKVTYHVACTKDEDTFDVLIAIPRVIDGAYIHLNGNDYFPLFQLVDGSTYNNTTAAAAKTQSITLKTNSNAVKMLRNFVDLNTTKEKTLRMAMFSVYLFDHKVTLFEYYLARFGWYETLSKFNFENIIKISDHDIDDPEYYTFAIANAHMKNPFYISAVKSFVDNDRILQSFIASFAKAISLYATKKTTLDQIYTTEFWVCKLGYNFVSSETSVFTKGNAIIESLENSYDIPTKKRLRLPDHIKEDIYSVLKWMACEFSSIRLKNNLDASSKRIRWSEYIAAMYIMLINVKLRRLPEKHDPNMEAYRIKQQLNTPPMALIAELQKSNLKGFRNMVNDRDSFLQLKYTIKGPSGPGESNSKNVARNVRAIDPSHLGIIDLNTSSASDPGVGGMLCPLNYGVYEWNSFTNEEEPNVWDDNFSKMLNIYREEKGYTSAIMLADDAGLELTDTRDPEAVAFDAHLLGQTIAKVARTRAFEKQLRPALINMEDSCSIYFEEV*
Ga0115107_100006	Ga0115107_10000615	F095631	MASDAVSVNKTLRSYQETVLNTVQNDTLLNANIYDIHQYIENIKKRYVDEDEITLSMGIFGYLGDVNSNALQNAVTMAAEYSNEAIPIKAKFEKNVISHALMLGINKIFAEPATMQAMFVFYEDELVLNTISDTFRFDRDIKIMVGDYEFHLPYDLIIKRIELPTGEYIYTGMYDTTQSNPIITRNSNDVDPYLKPTVRSKIDGRNVVMLLVDLRQYEYMTYHKTIITNNPLESKMLQFEFDNQLAGFDVDVKEYDQPTRKLKPVYNGLNTDGVQNFCNYTYIDSSTIRVMFDNTSYLPTANTEVTVNLYTSQGANGNISYKDSIYFRVKSDKMNYDRLNLLVIPTSDSQYGIDKKSIADLKRLIPKEALARGSVTNSTDINNYFNTIDDDDNKLFFFKKMDNPLARLYYAFVLMDSPTNIIPTNTIPIEAIRRDFDNISDSNYILTAGNIIKYDGTTNASIAYQASEDELNAARKNEFLYMNPFMCIVNKKPLYVSYYMNIMDVNKLLEFTYVNQDSKVQFIATKMNWYRHYISDRDTYFGDISIMQNIQSDIGLVHKDDPHDPEKITGVDIKVLAVFYTDDKYQVPYRWAEAEFVNYDQGTYVMDYKFKLNTDNKIDKNIKLKINNVYEVGNATRLSPGYMANNMHMKIFVFAKDVFGYNAGLHKSDQIFTADFLEGYSLTNEYTVKYGIDFLYNYSDLIESHIKVKKQDNGQISYIVDRVPVISYDYVNTEERIQDFINNLEKKRIHILDCLDVLEDSFGIDIKFFNTYGPSKLFYVNDGVPLNRVNLSMTFKVKFLTTTDKYLSEYIKNDIRKYIEDKSRISDIHIPNIVTYITQKYAENVTYFEFLDFNGYGPGYQHIYRKDESIVGRIPEFLNINTIGTENNALDINIIIA*
Ga0115107_100006	Ga0115107_100006160	F099452	MDKTYTELLQETLSKIYKLKDLNNRDRGKALTIFIGERLNRELLLSSMNIFNLYKEIVNLDDVSLLTDLRKTPWYKDWFTHSHENASLIDLSKFNFRSLERFEKEEYLKDVESYDFEAATTVDSYSLFDTLIEDNSVDLFKLAAENILINHGFFNNTDYNLYDIPDKYMEDTDVCLYMCLLNSDNMDFMDKKTFKSTELFYIVKNNICGTIFFTLFDRMNEDIRTRAR*
Ga0115107_100006	Ga0115107_100006199	F089057	MTNIIPLIAKKYNRKGDTSGTLKSLVDDLVFIGDANDSLLFITNIPRETKYSIEEVFNIITSNDKYSEILNNVLSSLNIDLDYHKLLLNAINSESYKIISLISDNIPTPDLFLSKNNYGCLTTALGKSYTIFDKVLGMVISQLLHTSSKEDKILGLFMTICIINKDIDKLASLCTGYLAITKDELAVKDLMNESAMTAFKYMSDEDIHDVVDDINSRMVLSRYLNQM*
Ga0115107_100006	Ga0115107_10000640	F081455	MENFLAKEIGTLIGKHFGFVDNIDLDKDPIITSNNIIDIPPVEEIGMQNVEIIDSAEEAIQQPLANTDSSIAVNFSQMINKPEEVKTELVSTPDNGEAKVNVVFPKNEHILGNYVDYESFNKIKESNTDKIVRAVRLLNYKMADQNAAMKFGQFVSEFNYECDPNKRLRYELIRHQGREKDLVVRLSTVINGTTKYYVDIYPDLNKIDIDHHLISSARK*
Ga0115107_100006	Ga0115107_10000641	F080166	VNILANFENYTKVVEQIFELNYQLTLKMEVTFNNIIKRINTEIKENFHTEYVVGANKLTTNLRYKYRMRLSPRGETVGVIIDWDNYDDLCNIIDEAIDICDPNNKTSPFKRIYSTAGDLLDIKCDSLKVRYLHLDDRFGNRLDLMPFVLIDDHNGTLTEAMKFRFNNDLIFDVPVSRLKGFRRFLMTYNPLLHAGSMARYMAITPLLGNNRQNMMRS*
Ga0115107_100006	Ga0115107_10000644	F099453	MNRFDIIELAQETLIFVYNTFNGKVNTLDPYTRLNFVAGYLDTKTNIARTTPYGCIYISLEAFADTVEAHKFIDTDQIRNLALEIIIHELTHVDQLIDYKYIKFNNGYRDEIELQCVKQSCQWILDNIQYIRSFGLVVIPEVYQARLANLTNVVYTPKYPMAIAMGKLEYMLGKKFREFSNNNIEIEYVDRLKTHYTFMVCENRIYINSANLNDLGERLLNDKQYTVEYLEYGDSKLVIKITQGA*
Ga0115107_100006	Ga0115107_10000666	F092229	MNKEYRFKHIPEVVLRNVKFIRENNIDIGNGDDVLDCMMEINPVLRQRIYDDYDLAKDVAERRFNSTIEDLDLTTILQKCTTRPYIAILNNIYFRYFNSKLIEDMFKLGESIKVLDLAIEYECEYYTVNSAKTNIRRYMQQAYFDKYAADADIISSHRVLTDPQVNAVKSAEFTYDLLMAARSENFNPEMVRDIFLKYGLKTNSSRNLYTRMDNNLSLYYYMEDYLDEYVKNGKVTYGSQEYRTIKEFKYLPLMNVLTQLTSSNPSGYILNHKLELVKENK*
Ga0115107_100006	Ga0115107_10000692	F105379	MVIQFQLSQSDIESLLSISKLLKCDKILYDRNYINSIIGVGPERSYFQTTSYMIDLDPSINNLLVNSLDLKNLSKATDGADITKTNVPVFDWDTVYIKSCMNSLREYQVDSHIIAKDDNFHESNCYSELMAGSASTGACRINVDKYLIDIPKSAMPTLKSDHVEAIVYEVPNRNFNVLRFKITKRNGIIVNQSMLFLPY*
Ga0115107_100006	Ga0115107_10000697	F095629	MEVFKMRELIICACLFGCFGVANAATPIEQPKEVKVVHNDDSVALHKKVYKLEQRVERLEKLLLEKEGK*
Ga0115107_100009	Ga0115107_10000916	F103431	MIDLDALIVGMLFFIQFFLQGIAWRVAIAHFLHAERGNAAAAAFDGAFGEDIADCHAEDDNDKDAESQKEGFHVCIPEG*
Ga0115107_100107	Ga0115107_10010736	F081510	MKLPNMKAIKSAAKHSYTVSKILAKKYAPVALVTTGLVGYGVAVYKGIQSGKKLEATKAKYEAKDEAGEEYTRLDVIKDVTKDVAVPVAIAVASTAAIGLGFAIQTNRLKAVSAALTMVTEEHARYRLRAKEVLDEETFKKIDAPIETKKVEIDGKEVEVESIVPKEGDFYGRWFKYSRHYASDDPDYNEAWVKEVDNMLTQKINTQSGGGMLTFAEVLDALGFEVPKAALPFGWTDTDGFYLEWDTHEVWNEDKQEHEPQIYVRWQTPRNLYSTTNLRDIIPGRKELA*
Ga0115107_100223	Ga0115107_10022348	F074985	MMELTDGGWYKTPRIIKGKDFLAHIHDTYASGNAMYVEFKASEGEVRILEYRQLYEVDTESAVLFTINTYPQESILLKNIEEYEFIQYRPQQAWKAIHMGSTKRFNLEQFDQLWLDQTFQKLHPVIVNHDGKFWHVMGLKLDVDADGSFWGLYLKRQDSDFMKEIRMPLTQKFIYNPISGSWSLDDPTQEIKDLEEIKQTLRADAILDVTVSGVPMKLIRVQEIAKGVLFFVFQDEEKNKRYYYNRPAIKLRIVTDPTTGEQKYLLDHIKAMYID*
Ga0115107_100279	Ga0115107_10027920	F054110	VNYQPTIKKLLKALQMNGRRYVVDVRQSWSKYDKPCKVYIINRMYTEEEYKLTFPHKYKKGKTFKQGQLYKKESEYSSTKQHEVLLFLVKTYKGGE*
Ga0115107_100437	Ga0115107_10043710	F103433	MKEWSKNKPGVVFFFVVWFILSISFIGNFFGTGLWNGWFDGFQKDSSAIVEKTAYCKNKYDYKGPLIAADSKDYNKIMMSQDCNPSQVKPYVSQYGLQARVIAGLSPNDASKIPAYIKKVSIFLAVLTAFLLALVVQKIRALFGGITASVFVVMLSFSPWIAGYARNIYWIEPLLIAPFVISFVGYQYFKKSKKLWLFYIIESVAMFLKLLNGYEYVSTIAISVLAPIIFFELIHKNVKIINLWKQAVPVFAATVVAFFGAYWVNFVSLTDYYGSSDKAASAINARASDRGISGIRSMRAYAVGNFKILRPESYNFINQLVNLDNMANNSGKTYKYIIVNVVNYLLLPAITLPVHINGMFGEFVQSILFWTILGYLIILSSRKIIGKKYSRPFLWSMNFSVIGAFCWLALMPGHALPHAHINGIIFYIPLLLFVYMLIGLWADYVVKRTVKYE*
Ga0115107_101220	Ga0115107_10122016	F046433	MIELPTSPDALSELNSVTPPDLTLQARDTSRNNPVTYVVDDGYMGTRTSDPRFRKMRRETTEYKALNEFLYFMKMVEPYVPDHIKDDARELRNELVFLGMSELHFAATALAKRLRHLLKVDNNPVYVDVGNSLSQCRVKNEMKSSQYILSLVLSKFLDDEFEEYEGRLKVYGGRGEIDKSSKILFLDDWIIGGDQMRERISVFGAYNNPGAHKVSVLVMAASSNCIDNGIGADSLWGEATYPVEAYYRLKNDHNDWGVSRVTGIHSSTDSTFGCEVDDIAYRAIEGGVLKGERIDRLTLPALVNIVRPYRNGEDFDGLSRFRQLLEKG*
Ga0115107_101875	Ga0115107_10187513	F095633	MRNYENSTEVGRREGLTEGELRTMGTLAMEATEELKKTTVRKETVLLGSVPFGSWDEFAKAVQEMAAHSYEPIPVKINTKRLIATAFLDDRGEMSVEENSVPEEVFIDLSRTRCVVDADRSHKSYEFTCPVLKKYPDGELYPIREAHVISAIDVNGSQEVDFKII*
Ga0115107_103649	Ga0115107_1036491	F078842	MIISSIYKTADNDGLIAHIYEHLLAQYVLKRLQDNEFFVLSDIILSAKTYGDTCFMDAELYSPEAKKTYDEALREFDKLVIPEDDILRAAGECGIEMNRNIVEVDRSELSKKLREVQISPWRKQIDMAYRKAQDESSVNTLFRTSYIKYSKESDDLFRECVLEYSIDESHIQTPVDQALAAIVMQIVALNFLTVVREKYTVYDRGDQWSEASISVGYRMFLGSLKKDDKIINQLGCDFLEYIKILSSSVFCDNLQKALVRCSDNHKQVILNRSVLNAILGGCVIGGKGWLEMASSAQIRRMINSIELDIYEVNS*
Ga0115107_104032	Ga0115107_1040323	F054110	VNYQPTIKKLLKALQMNGRRYVVDVRQSWSKYDKPCKIYIVSRMYNEEEYKLTFPHKYKKGKTFKPKQLYKKESEYSSTKQHEVLLFLVKTYKGGD*
Ga0115107_104138	Ga0115107_1041381	F018385	MMADLVNSWLPYQELSIEKDRDPVTDDEIIYGNNVKHFTLTIYSPEGRISKYWNARILQDQLGRCRIACPRDGKILCFAWFEWTSYMFSHDGLNELVFMPRTNSRLPSTLWNTKEVK*
Ga0115107_104348	Ga0115107_1043483	F092230	MVDKLKTHLLKVFLPLFIVCIILVAFFRQIGCGSDGDYAFQISEWGAKLKNIYGTDFINKEIIVRDNAVRVDGIRCLYAVNQNEDGLSIYLLLPGGDYLTHNYVGSSFVRFSNSSEYNNMAYGEGNVEVSDSTSTGEVQNTEEKEARDKVDDAINSMRHLFASAIMVNLRVVELYKILTVCMILIAIAMTVGYYSYLKPETVYEFYCKLRRKEKYPSDENLVKRIGFLVIILPPCMLFLLIV*
Ga0115107_106958	Ga0115107_1069581	F032313	MYRFLILLFALTLMACDNNTPQEKPHEQEKHEVPVPVSKPQFDEVGERIWYGRTPAMRLDSTDYGAGLTSVFGMRTSSIPKQRFDSLFKQTVWEIKDIRVVETDLSLAKKNPGIMGWITTTEFTCRNGVIVLHRQGIDVNHVDTVNYVYDEVGNEIVLEGTGIRWSVLRLNKNAVEFLQRGRTMWGPFDWYYGRNSGRSEVTLEAK*
Ga0115107_106958	Ga0115107_1069582	F032313	MYRLLILLFAITLMACDNDTPQEKPREQEKHEVPVPKPKPQFDEVGERIWYGQTPAMRLDSTDYGAGLIWVLEMRTSSIPKQRFDSLFKQTVWEIKDICAVETDLSLAKKIPKFVGGSITKEFTCRNGVILRHMQGVDINCVDTVNYVYNEDLNEIVLEGTGIRWYVLRLNKYAVEFLQQGHNIWGPFDWYYGRNSGRSEVTLEAK*
Ga0115107_107764	Ga0115107_1077643	F066860	MTTKKQKLQKQQAIDTWIVIALWVSAIWFSFARGFITGIGGWVLALLAPWALIVSCICLAIISRQMKKRHVSKDHLTTIVRASFIVMSISLFICGLAMPDFSDTETFSTLSVYTNNAISFETSKTIAIISGFVVVLSLLVVVTFGIAEDRE*
Ga0115107_110917	Ga0115107_1109171	F046433	VEPYVPDHIKDDARELRNELVFLGMSELHFAATALAKRLRYYLEVDNKPVYIDVGNSLSQCRVKNEMKSSQYILSLVLSKFPDDEFEEYEGRLKVYGGRGEIDKSSKILFLDDWIIGGDQVKERIAGFEAYNNPGAHKVSVLVMAASSKCIDNGIGADPLWGKATYPVEAYYRLKNDHDDWGMSRVTGIHSSTDRVFGCEVDDIAYCAIDGGILKGERIDRLTLPALVNIVRPYRNGEDFDGLSRFRQLLEKG*
Ga0115107_113793	Ga0115107_1137932	F054110	VNYQPTIKKLLTALRMNGRRYVVDTRQSWSKYDKPCKIYIVSRMYNEEEYKLTFPHKYKKGKTFKQGQLYKKESEYSSTKQHEVLLFLVRTYKGGE*

Bioinformatics & Integrated Biology Lab
Institute for Fundamental Biomedical Research
Biomedical Sciences Research Center "Alexander Fleming"

NMPFamsDB

NMPFamsDB

NMPFamsDB

A database of Novel Metagenome Protein Families

A database of Novel Metagenome Protein Clusters

A database of Novel Metagenome Protein Clusters

3300008362: Human tongue dorsum microbial communities from NIH, USA - visit 1, subject 160400887 reassembly

Overview

Ecosystem and Geography

Associated Families

Associated Scaffolds

Sequences