Sample 3300008333

Basic Information
IMG/M Taxon OID	3300008333 Open in IMG/M
GOLD Reference (Study \| Sequencing Project \| Analysis Project)	Gs0063646 \| Gp0053264 \| Ga0115302
Sample Name	Human tongue dorsum microbial communities from NIH, USA - visit 1, subject 508703490 reassembly
Sequencing Status	Permanent Draft
Sequencing Center	Baylor College of Medicine, J. Craig Venter Institute (JCVI), Washington University in St. Louis
Published?	N
Use Policy	Open

Basic Information

IMG/M Taxon OID

3300008333 Open in IMG/M

GOLD Reference
(Study | Sequencing Project | Analysis Project)

Gs0063646 | Gp0053264 | Ga0115302

Sample Name

Human tongue dorsum microbial communities from NIH, USA - visit 1, subject 508703490 reassembly

Sequencing Status

Permanent Draft

Sequencing Center

Baylor College of Medicine, J. Craig Venter Institute (JCVI), Washington University in St. Louis

Published?

Use Policy

Open

Dataset Contents
Total Genome Size	123636095
Sequencing Scaffolds	14
Novel Protein Genes	25
Associated Families	23

Dataset Contents

Total Genome Size

123636095

Sequencing Scaffolds

Novel Protein Genes

Associated Families

Dataset Phylogeny
Taxonomy Groups	Number of Scaffolds
All Organisms → cellular organisms → Bacteria → Bacteria incertae sedis → Bacteria candidate phyla → Candidatus Saccharibacteria → Candidatus Saccharimonas → Candidatus Saccharimonas aalborgensis	2
All Organisms → Viruses → Duplodnaviria → Heunggongvirae → Uroviricota → Caudoviricetes → Caudovirales	1
All Organisms → cellular organisms → Bacteria → FCB group → Bacteroidetes/Chlorobi group → Bacteroidetes → Bacteroidia → Bacteroidales → Prevotellaceae → Alloprevotella → Alloprevotella sp. oral taxon 473	2
All Organisms → cellular organisms → Bacteria → Proteobacteria → Gammaproteobacteria → Pasteurellales → Pasteurellaceae → Haemophilus	1
All Organisms → cellular organisms → Bacteria	2
All Organisms → cellular organisms → Bacteria → Proteobacteria → Gammaproteobacteria → Pasteurellales → Pasteurellaceae	1
All Organisms → cellular organisms → Bacteria → FCB group → Bacteroidetes/Chlorobi group → Bacteroidetes → Bacteroidia → Bacteroidales → Prevotellaceae	1
All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Negativicutes → Veillonellales → Veillonellaceae → Veillonella → Veillonella tobetsuensis	1
All Organisms → cellular organisms → Bacteria → Proteobacteria → Gammaproteobacteria → Pasteurellales → Pasteurellaceae → Haemophilus → Haemophilus parainfluenzae	1
All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Clostridia → Eubacteriales → Lachnospiraceae	1
All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Bacilli → Lactobacillales → Streptococcaceae → Streptococcus	1

Dataset Phylogeny

Taxonomy Groups

Number of Scaffolds

All Organisms → cellular organisms → Bacteria → Bacteria incertae sedis → Bacteria candidate phyla → Candidatus Saccharibacteria → Candidatus Saccharimonas → Candidatus Saccharimonas aalborgensis

All Organisms → Viruses → Duplodnaviria → Heunggongvirae → Uroviricota → Caudoviricetes → Caudovirales

All Organisms → cellular organisms → Bacteria → FCB group → Bacteroidetes/Chlorobi group → Bacteroidetes → Bacteroidia → Bacteroidales → Prevotellaceae → Alloprevotella → Alloprevotella sp. oral taxon 473

All Organisms → cellular organisms → Bacteria → Proteobacteria → Gammaproteobacteria → Pasteurellales → Pasteurellaceae → Haemophilus

All Organisms → cellular organisms → Bacteria

All Organisms → cellular organisms → Bacteria → Proteobacteria → Gammaproteobacteria → Pasteurellales → Pasteurellaceae

All Organisms → cellular organisms → Bacteria → FCB group → Bacteroidetes/Chlorobi group → Bacteroidetes → Bacteroidia → Bacteroidales → Prevotellaceae

All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Negativicutes → Veillonellales → Veillonellaceae → Veillonella → Veillonella tobetsuensis

All Organisms → cellular organisms → Bacteria → Proteobacteria → Gammaproteobacteria → Pasteurellales → Pasteurellaceae → Haemophilus → Haemophilus parainfluenzae

All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Clostridia → Eubacteriales → Lachnospiraceae

All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Bacilli → Lactobacillales → Streptococcaceae → Streptococcus

Ecosystem Assignment (GOLD)
Name	Human Microbial Communities From The National Institute Of Health, Usa, Hmp Production Phase
Type	Host-Associated
Taxonomy	Host-Associated → Human → Digestive System → Oral Cavity → Tongue Dorsum → Human → Human Microbial Communities From The National Institute Of Health, Usa, Hmp Production Phase

Ecosystem Assignment (GOLD)

Name

Human Microbial Communities From The National Institute Of Health, Usa, Hmp Production Phase

Type

Host-Associated

Taxonomy

Host-Associated → Human → Digestive System → Oral Cavity → Tongue Dorsum → Human → Human Microbial Communities From The National Institute Of Health, Usa, Hmp Production Phase

Alternative Ecosystem Assignments
Environment Ontology (ENVO)	Unclassified
Earth Microbiome Project Ontology (EMPO)	Host-associated → Animal → Animal surface

Alternative Ecosystem Assignments

Environment Ontology (ENVO)

Unclassified

Earth Microbiome Project Ontology (EMPO)

Host-associated → Animal → Animal surface

Location Information
Location	National Institutes of Health, USA
Coordinates	Lat. (^o)	N/A	Long. (^o)	N/A	Alt. (m)	N/A	Depth (m)	N/A
Location on Map

Zoom:	Powered by OpenStreetMap^©

Location Information

Location

National Institutes of Health, USA

Coordinates

Lat. (^o)

N/A

Long. (^o)

N/A

Alt. (m)

N/A

Depth (m)

N/A

Location on Map

Zoom:

Family	Category	Number of Sequences	3D Structure?
F032313	Metagenome	180	N
F033081	Metagenome	178	Y
F046433	Metagenome	151	N
F054110	Metagenome	140	N
F067846	Metagenome	125	Y
F073671	Metagenome	120	N
F077405	Metagenome	117	N
F080166	Metagenome	115	N
F081455	Metagenome	114	N
F085820	Metagenome	111	N
F089055	Metagenome	109	Y
F089057	Metagenome	109	N
F092229	Metagenome	107	N
F092230	Metagenome	107	N
F094007	Metagenome	106	N
F095629	Metagenome	105	N
F095631	Metagenome	105	N
F097527	Metagenome	104	N
F099452	Metagenome	103	N
F099453	Metagenome	103	N
F103432	Metagenome	101	N
F103433	Metagenome	101	N
F103435	Metagenome	101	N

Family

Scaffold	Taxonomy	Length	IMG/M Link
Ga0115302_100002	All Organisms → cellular organisms → Bacteria → Bacteria incertae sedis → Bacteria candidate phyla → Candidatus Saccharibacteria → Candidatus Saccharimonas → Candidatus Saccharimonas aalborgensis	329620	Open in IMG/M
Ga0115302_100003	All Organisms → Viruses → Duplodnaviria → Heunggongvirae → Uroviricota → Caudoviricetes → Caudovirales	232039	Open in IMG/M
Ga0115302_100067	All Organisms → cellular organisms → Bacteria → FCB group → Bacteroidetes/Chlorobi group → Bacteroidetes → Bacteroidia → Bacteroidales → Prevotellaceae → Alloprevotella → Alloprevotella sp. oral taxon 473	83519	Open in IMG/M
Ga0115302_100087	All Organisms → cellular organisms → Bacteria → Proteobacteria → Gammaproteobacteria → Pasteurellales → Pasteurellaceae → Haemophilus	69251	Open in IMG/M
Ga0115302_100139	All Organisms → cellular organisms → Bacteria	52455	Open in IMG/M
Ga0115302_100214	All Organisms → cellular organisms → Bacteria → Bacteria incertae sedis → Bacteria candidate phyla → Candidatus Saccharibacteria → Candidatus Saccharimonas → Candidatus Saccharimonas aalborgensis	42209	Open in IMG/M
Ga0115302_100344	All Organisms → cellular organisms → Bacteria	32153	Open in IMG/M
Ga0115302_100602	All Organisms → cellular organisms → Bacteria → FCB group → Bacteroidetes/Chlorobi group → Bacteroidetes → Bacteroidia → Bacteroidales → Prevotellaceae → Alloprevotella → Alloprevotella sp. oral taxon 473	21575	Open in IMG/M
Ga0115302_101121	All Organisms → cellular organisms → Bacteria → Proteobacteria → Gammaproteobacteria → Pasteurellales → Pasteurellaceae	13847	Open in IMG/M
Ga0115302_101905	All Organisms → cellular organisms → Bacteria → FCB group → Bacteroidetes/Chlorobi group → Bacteroidetes → Bacteroidia → Bacteroidales → Prevotellaceae	9603	Open in IMG/M
Ga0115302_104615	All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Negativicutes → Veillonellales → Veillonellaceae → Veillonella → Veillonella tobetsuensis	4775	Open in IMG/M
Ga0115302_105299	All Organisms → cellular organisms → Bacteria → Proteobacteria → Gammaproteobacteria → Pasteurellales → Pasteurellaceae → Haemophilus → Haemophilus parainfluenzae	4240	Open in IMG/M
Ga0115302_106777	All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Clostridia → Eubacteriales → Lachnospiraceae	3399	Open in IMG/M
Ga0115302_113815	All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Bacilli → Lactobacillales → Streptococcaceae → Streptococcus	1685	Open in IMG/M

Sequences

Scaffold ID	Protein ID	Family	Sequence
Ga0115302_100002	Ga0115302_100002193	F046433	MIELPTNPDALSELSPVVPPKLLSQAQDASRDNLMVYVKADNYLGTETSDPSFMESRCETTEYEAINDFVQFIEMTKHYLPDYMENCAKELIDELAFLGMPELNFAANALAKRLRHHLEIDNKPVYIDVGNSLSQYRAKNEMKSSQYILSLVLSKFPDDEFEEYEGRLKVYGGRGEIDKSSKILFLDDWIIGGDQVRERISGFEVDNDPESHEASVLVMAASGDYLDNGISAYSRYGGTIYPVEACYVLKNSSDAGGVSRVTGIHSSTDNTFGYEVDGIAYCAIERGILKGERIDDLSLPALANIVRPYRNGKNFDGLSRFRQLLEKE*
Ga0115302_100002	Ga0115302_100002272	F033081	MHTDITVVYRPKKGVMAWLFRRAMPQDTRPTFVWSRLVTEIENAGYFSRRKFSILAVGLIIMTIAMIKMLLFVPGLNQSVVSLLTRGLETFLPTGWATATAWTVGMAGVFLMGNFTNYTPSQKFLHKIKATRYEVYNILLLLALLEEQAFRSGSERWNWRERVRASVCFGLLHITNIWYSFAAGIALSVTGFGFLLVYLWYYRKYRIQIIATAAAATVHALYNAIALSLIAIVLAIDITKLL*
Ga0115302_100003	Ga0115302_100003105	F095631	MASDAVSVNKTLRSYQETVLNTVQNDTLLNANIYDIHQYIENIKKRYVDEDEITLSMGIFGYMGDVNSNALQNAVTMAAEYSNEAIPIKAKFEKNVISHALMLGINKIFAEPATMQAMFVFYEDELILNTVSDTFKFDRNIKIMVGDYEFHLPYDLIIKRIELPTGEYIYTGMYDTTQSNPIITRNSNDVDPYLKPTVRSKIDGRNVVMLLVDLRQYEYTTYHKTIITTNPLESKMLQFEFDNQLAGFDVDVKEYDQPTRKLKPVYNGLNTDGISNFCNYTYIDSSTIRVMFDNSSYLPTANTEVTVNLYTCQGANGNISYKDSIYFRVKSEKINYDRLNLLVIPTSDAQYGIDKRSIADLKKLIPKEALSRGSVTNSTDINNYFNTIDDDDNKLFFFKKMDNPLARLYYAFVLMDSPTNIIPTNTIPIEAIRRDFDNISDSNYILTAGNIIKYDGTTNASVAYQSSEEELNNARRNQFLYMNPFMCIVNKKPLYVSYYMNIMDVNKLLEFTYVNQDSKVQFVANKMNWYRHYLSERDTYVGDISIMQNIQSDIGLVHRDDPYNPEKITGVDVKVLAVFYTDEKYQVPYRWAEAEFVNYDQNTFIMDYKFKLNTDNKIDKNIKLKINNVYEVGNATRLSPGYMANNMNMKIFVFAKDVFGYNAGLHKADQIFTADFLEGYSLTNEYTVKYGIDFLYNYSDLIESHIKIRKQDNGQISYIIDRVPVISYDYVNTEERIQDFINNLEKKRIHILECLDVLEDSFGIDIKFFNTYGPSKLFYVNDGVPLNRVNLSMTFKVKFLTTTDKYLTEYIKNDIRKYIEDKSRISDIHIPNIITFITQKYAENVTYFEFLDFNGYGPGYQHIYRKDESIVGRIPEFLNINTIGTENNALDINIIIA*
Ga0115302_100003	Ga0115302_100003133	F103435	MKFVFTTEPIYQYYRAYLYPSDKDKLDKDLMVEYGDYKDYWDLKNQQDALPENIFVAELTSRDYPRNPWNYVSQLISKLTYSYLIDNPEFENIFSEILLNQSEEEFYEFYKAIDRFYNGSEIFIIVSNDEYSDMVTQMMCNVIRRMYGIHPQVIYDIDDVLNIRDDIDFSPQGAQLAYLQRSAYYKLEAKRSLEPLQIWYPFDMNTYTNALE*
Ga0115302_100003	Ga0115302_100003141	F089057	MINVIPLIAKKYNRKGDTSGSLKSLISDLNCVTDNDDVLLFLSSIPRETKYSLDDAFDIIVSDDTYSNIFRATLVFLNIDLDYHRLLLNAIKSESYTIICMINKAIPTPDLFLAKNNYECLTIALDKSYAVFDKVLGMVVGQIKHTASSKEGRALGIFMTLCILNKDIDKLASLCTGYLATCRSEYMVKDLMNKSAMDAFQYMSEEDIHTVVDDINSRSVLSRYLNKM*
Ga0115302_100003	Ga0115302_100003182	F099452	MDKTYTELLQETLSKIYELKDLNNRDRGKALTIFIGERLNRELLLSSMNIFNLYKEIVNLDDVSLLTDLRKTPWYKKWFTYDQENSRLIDLSKFNFRSLERFEKVEYLKDAEHYDFEGVIEVDSYSLYDTLAEENGLNLFCFAAENILLNHGFFNNTDYQLYDVPEEYIDDQEVCMYMCLLNKDNIDFIDKNTYEDSVLYDIVRDRIFNAIYWSIRDSIEEDTRTRAR*
Ga0115302_100003	Ga0115302_10000325	F095629	MRELIICVCLLGCFGVVNANNVEQPKEVKIVHNDDSIILHKKIYQLEKRIERLEELLKKEGK*
Ga0115302_100003	Ga0115302_10000354	F092229	MNKEYRFNHIPEVVLRNIRFIRDNNIDIGTGDDVLECMMDINPVVRTKIYDDYEFAKDVAERRFGSTIEKLDLRTVLQKCITRPYNSILNNIYFRYFNSELIDDLFKLGQSSKVLDLAIKYECEYYTVNAAKTNIRRYNTDAYYNKFAADSNIISSHRSLHDPQVNAVKSAEFTYDLLMASRAEEFNPEIVREIFVKYGLKPNSSRNLYNRINDNLNLFYYIEDYLEEYREEGRFIYGTKEYKILKELRSLPLMVVLTQLTRKNDSGYILNSNLELVKG*
Ga0115302_100003	Ga0115302_10000373	F099453	MLRRKDMNRFDVIELAQQTLTFVYNTFNGKVNTLDPYTRLNFVSGYLDTKTNIARTTPYGCIYVSLEAFADTVERQGFIDTDQIRNLALEIIIHELTHVDQLIDYKYIKFNNGYREEVELKCVKQSCQWILDNMQYIRSLGLVVIPEVYQARLANLTNVIYTPKYPIAIAMAKLEYMLGKKFREFSNNNIEIQYIDRLKTHYSFMVCENRSYINSRNLNDLGERLLNDKQYTVEYLEYGNSKLVIKITQGA*
Ga0115302_100003	Ga0115302_10000376	F080166	VNILANFENYNKVVEQIFELNYYLTFKLEVTFNTIHKKINTEIKENFHSEYVVGANKLTTNLRYKYQMRLSPRGEKIGIVIDWDNYDDLCTVIEEAINICDPENKMSPFRRLYSTTGDLLDIKCDSLKVRYLHLEDRWNNKVDLIPFVLVDDNRGTLTEAMRFRFNNDLTFDVPVSRLKGFRRFLMTYNPVLHAGAMARYMAMTPLLGSNRQNMLR*
Ga0115302_100003	Ga0115302_10000377	F081455	MEPLGKNSIKLMEKVLDNIILKSKKDIPPAEEIGAETVDIIDSAEEAIQQPLENKDSSIAVNFSQMVNKPKEEVKTEVNSVPPEGETKVNVLFPKTEHILGNYVDYDSFIKIKESNTDKVVRAVRLLNYKMSDQNAAAAFAQFVSEFNPECDPNKRLRYELIRHQGREKDLVIRLSTVINGKTKYYADIYPDLNKIDLDHHLISSAKK*
Ga0115302_100067	Ga0115302_10006716	F103432	MKLIHSLFSLPLLFVLGGLFCTTACQDDVEPTQRTGLISTDSLIHAAEVYDGKAFEHVVSTTATGLRVSEPRRVVPMLPRQLHVTMDGKTIFRRHTLPSVSAYSLQVVAVGDTIYRQKESDAQFNADLDALFRQSIGIAPRLFGVRELSVAGIDRKGKPRDLGNYSCPLLQGKRRNVNFRTKEGVFHEYFEAASVDTFSVKSNWLLKTKAEPSLYAPSFRLLVWEQPAEGCTKLRFTLTLVDGRSLVAEVPLR*
Ga0115302_100087	Ga0115302_10008727	F073671	MNKQQAEHELAELHEKERSLEKALELVREKIRELVNYTDKNKV*
Ga0115302_100087	Ga0115302_10008732	F067846	MESLQAQWERKTFDDYDRRCCAEDAYNEAVEREIECIEDDISNGDSDAICAFSEKMFDDDEFLKAVALGADYEEMRIKILTAMAEDRLEQLEEDYRKGFILND*
Ga0115302_100139	Ga0115302_10013914	F094007	MKSKTVEVLALARPNRAGVIDVVDSDGNVVPLDYLGEDFVPDVNSYSDEDFTKRNRIIVEMCDLFGRIRRRAGFAEYHRGRGNYDRARRIERNRGSDISEVGRLAINACEACPLKLDCELYGKLGGAVLSDVLDYKKVRTATSLTKAGKKRSGWNKGCIDNNA*
Ga0115302_100214	Ga0115302_10021424	F089055	LKVEKMNSTPECVTKTPEIEAREKLAAIFSDAEQRGDNSKVSPELGKAAIDIENTSKMDSADNGAVDFCNQALGGYGKSLDYINNSPLETVQAIGNSLQLFREDKTKESCK*
Ga0115302_100344	Ga0115302_1003443	F103433	MKEWSKNKPGVVFFFVVWFILSISFIGNFFGTGLWNGWFDGFQKDSSAIVEKTAYCKNKYDYKGPLIAADSKDYNKIMMSQDCNPSQVKPYVSQYGLQARVIAGLSPNDASKIPAYIKRVSIFLAVLTAFLLALVVQKIRALFGRITASVFVVMLAFSPWIAGYARNIYWIEPLLIAPFVISFVGYQYFKKLKKLWLFYIIESVAMFLKLLNGYEYVSTIAISVLVPIIFFELVHKNVKIINLWKQAVPVFAATVVAFSGAYWVNFISLTDYYGSSDKAASAINARASDRGISGIRSMRAYAVGNFKILRPETYNFINQLVNLDNMANNSGKTYKYIIVNVVNYLLLPAITLPVHINGMFGEFIQSILFWTILGYLIILSSRKIIGKKYNRPFLWSMNFSVIGAFCWLALMPGHALPHAHINGIIFYIPLLLFVYVLIGLWADYVVKRTVKYE*
Ga0115302_100602	Ga0115302_1006023	F085820	MRSTFYLFAMLFLATTFFSCETVEPSPRPTWGEIVNPIEAFMYPRDLKVVAAREEGRRWLILVVPDSTKSSFAPTSKSTPAEVARYKELSKLVGNPTEPVVNECHFHRTWLTQGVKAIRVVRTQADGRDEEVTAQCGNLYFYTDKQIFDCQFKCGDRSIFAKPLGETVEADYLWLPGRDVFGLIAPPNPDHLKQRIVLRLADGTEIEKELSEKRKK*
Ga0115302_101121	Ga0115302_10112112	F067846	MESLQAQWERKTFNDYDRRCCAEDAYNEAVEREIECIEEDIANNDSDALCAFSEKMFDDDEFLKAVALGTDYEEMRIKILTAMAEDRLEQLEKDYKNGYILND*
Ga0115302_101121	Ga0115302_10112118	F073671	MNKQQAEHELAELHEKERSLEKALELVREKIRELINYTDKNKGNNNGAKF*
Ga0115302_101905	Ga0115302_1019053	F032313	MNFMSNCNWRAQSVSIESFKIVLMYRFLILIFALTLMACDNNTPQEKPHEQEKHEVPVPVSKPQFDEVGERIWYGRTPAMRLDSTDYGAGLTSVFGMRTSSIPKQRFDSLFKQTVWEIKDIRVVETDLSLAKKNPGIMGWITTTEFTCRNGVIVLHRQGIDVNHVDTVNYVYDEVGNEIVLEGTGIRWFVLRLNKNAVEFLQRGRTMWGPYDWYYGRNSGRSEVTLEAK*
Ga0115302_104615	Ga0115302_10461510	F054110	MNGRRYVVDVRQSWSKYDKPCKVYIVNRMYTEEEYKLTFPHKYKKGKTFKQGQLYKKESEYSSTKQHEVLLFLVKTYKGGD*
Ga0115302_105299	Ga0115302_1052995	F077405	GRALPTELFPRLLVAKQRGVFYGFISWCQIKFVKKFFD*
Ga0115302_106777	Ga0115302_1067772	F092230	MRQAHKRTVDKLKAYLLKVFFPLFIVCIILVAFFRQIGCGSEGEYAFQISEWGAKLKNIYGTDFINKEIIVRDNAVRVDGIRCLYAVNQNEDGLSIYLLLPEGTYLTHNYVGSSFVRFSNSSEYINMAYGEGSVEVSDSTSTGEVQNTEEKEARDKVDEAINSMRQLFASAIMVNLRVVELYKILTVCMILIAIAMTIGYFSYLKPETVYGFYCKLRRKEKYPSDVNLVKRIGFLVIILPPCMLFLLIV*
Ga0115302_113815	Ga0115302_1138151	F097527	MIYFKMEKIGNSTYNKEKKTRSENLVFNTIPAAGVEPARPCGHWILSSITPLF

NMPFamsDB

NMPFamsDB

NMPFamsDB

A database of Novel Metagenome Protein Families

A database of Novel Metagenome Protein Clusters

A database of Novel Metagenome Protein Clusters

3300008333: Human tongue dorsum microbial communities from NIH, USA - visit 1, subject 508703490 reassembly

Overview

Ecosystem and Geography

Associated Families

Associated Scaffolds

Sequences