Sample 7000000736

Basic Information
IMG/M Taxon OID	7000000736 Open in IMG/M
GOLD Reference (Study \| Sequencing Project \| Analysis Project)	Gs0063646 \| Gp0053330 \| Ga0030476
Sample Name	Human stool microbial communities from NIH, USA - visit 1, subject 763678604
Sequencing Status	Permanent Draft
Sequencing Center	Baylor College of Medicine, J. Craig Venter Institute (JCVI), Washington University in St. Louis
Published?	N
Use Policy	Open

Basic Information

IMG/M Taxon OID

7000000736 Open in IMG/M

GOLD Reference
(Study | Sequencing Project | Analysis Project)

Gs0063646 | Gp0053330 | Ga0030476

Sample Name

Human stool microbial communities from NIH, USA - visit 1, subject 763678604

Sequencing Status

Permanent Draft

Sequencing Center

Baylor College of Medicine, J. Craig Venter Institute (JCVI), Washington University in St. Louis

Published?

Use Policy

Open

Dataset Contents
Total Genome Size	195916482
Sequencing Scaffolds	18
Novel Protein Genes	19
Associated Families	19

Dataset Contents

Total Genome Size

195916482

Sequencing Scaffolds

Novel Protein Genes

Associated Families

Dataset Phylogeny
Taxonomy Groups	Number of Scaffolds
All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Clostridia → Eubacteriales	10
Not Available	1
All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Clostridia → Eubacteriales → Oscillospiraceae	1
All Organisms → Viruses → Predicted Viral	2
All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes	1
All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Bacilli → Bacillales → Paenibacillaceae	1
All Organisms → Viruses → Duplodnaviria → Heunggongvirae → Uroviricota → Caudoviricetes → unclassified Caudoviricetes → Myoviridae sp. ct3pM2	1
All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Clostridia	1

Dataset Phylogeny

Taxonomy Groups

Number of Scaffolds

All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Clostridia → Eubacteriales

Not Available

All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Clostridia → Eubacteriales → Oscillospiraceae

All Organisms → Viruses → Predicted Viral

All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes

All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Bacilli → Bacillales → Paenibacillaceae

All Organisms → Viruses → Duplodnaviria → Heunggongvirae → Uroviricota → Caudoviricetes → unclassified Caudoviricetes → Myoviridae sp. ct3pM2

All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Clostridia

Ecosystem Assignment (GOLD)
Name	Human Microbial Communities From The National Institute Of Health, Usa, Hmp Production Phase
Type	Host-Associated
Taxonomy	Host-Associated → Human → Digestive System → Large Intestine → Fecal → Human → Human Microbial Communities From The National Institute Of Health, Usa, Hmp Production Phase

Ecosystem Assignment (GOLD)

Name

Human Microbial Communities From The National Institute Of Health, Usa, Hmp Production Phase

Type

Host-Associated

Taxonomy

Host-Associated → Human → Digestive System → Large Intestine → Fecal → Human → Human Microbial Communities From The National Institute Of Health, Usa, Hmp Production Phase

Alternative Ecosystem Assignments
Environment Ontology (ENVO)	Unclassified
Earth Microbiome Project Ontology (EMPO)	Host-associated → Animal → Animal surface

Alternative Ecosystem Assignments

Environment Ontology (ENVO)

Unclassified

Earth Microbiome Project Ontology (EMPO)

Host-associated → Animal → Animal surface

Location Information
Location	National Institutes of Health, USA
Coordinates	Lat. (^o)	N/A	Long. (^o)	N/A	Alt. (m)	N/A	Depth (m)	N/A
Location on Map

Zoom:	Powered by OpenStreetMap^©

Location Information

Location

National Institutes of Health, USA

Coordinates

Lat. (^o)

N/A

Long. (^o)

N/A

Alt. (m)

N/A

Depth (m)

N/A

Location on Map

Zoom:

Family	Category	Number of Sequences	3D Structure?
F039147	Metagenome	164	N
F043945	Metagenome	155	N
F044554	Metagenome	154	N
F051934	Metagenome	143	N
F051935	Metagenome	143	N
F055739	Metagenome	138	N
F055775	Metagenome	138	N
F056682	Metagenome	137	Y
F070133	Metagenome	123	N
F073573	Metagenome	120	N
F073574	Metagenome	120	N
F075480	Metagenome	119	N
F077319	Metagenome	117	N
F077320	Metagenome	117	N
F078003	Metagenome	117	N
F078004	Metagenome	117	N
F089054	Metagenome	109	N
F095494	Metagenome	105	N
F096287	Metagenome	105	N

Family

Scaffold	Taxonomy	Length	IMG/M Link
C3394277	All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Clostridia → Eubacteriales	598	Open in IMG/M
C3395925	Not Available	603	Open in IMG/M
C3498179	All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Clostridia → Eubacteriales	1312	Open in IMG/M
C3512731	All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Clostridia → Eubacteriales	1619	Open in IMG/M
C3555201	All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Clostridia → Eubacteriales	6784	Open in IMG/M
SRS014235_WUGC_scaffold_40175	All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Clostridia → Eubacteriales	6168	Open in IMG/M
SRS014235_WUGC_scaffold_42668	All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Clostridia → Eubacteriales	2343	Open in IMG/M
SRS014235_WUGC_scaffold_47231	All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Clostridia → Eubacteriales → Oscillospiraceae	8582	Open in IMG/M
SRS014235_WUGC_scaffold_52680	All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Clostridia → Eubacteriales	4016	Open in IMG/M
SRS014235_WUGC_scaffold_61618	All Organisms → Viruses → Predicted Viral	3799	Open in IMG/M
SRS014235_WUGC_scaffold_66688	All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Clostridia → Eubacteriales	3992	Open in IMG/M
SRS014235_WUGC_scaffold_67642	All Organisms → Viruses → Predicted Viral	2881	Open in IMG/M
SRS014235_WUGC_scaffold_67678	All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes	7615	Open in IMG/M
SRS014235_WUGC_scaffold_69784	All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Bacilli → Bacillales → Paenibacillaceae	7118	Open in IMG/M
SRS014235_WUGC_scaffold_70483	All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Clostridia → Eubacteriales	4405	Open in IMG/M
SRS014235_WUGC_scaffold_71218	All Organisms → Viruses → Duplodnaviria → Heunggongvirae → Uroviricota → Caudoviricetes → unclassified Caudoviricetes → Myoviridae sp. ct3pM2	2353	Open in IMG/M
SRS014235_WUGC_scaffold_71737	All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Clostridia → Eubacteriales	2253	Open in IMG/M
SRS014235_WUGC_scaffold_73314	All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Clostridia	8463	Open in IMG/M

Sequences

Scaffold ID	Protein ID	Family	Sequence
C3394277	C3394277__gene_243814	F073574	MFHAASRRRAPLCRDVDDTASRVRCAIVLNGSKELHIQLCGRLKRGLFGRNQLLADGDVLCVALHQPDGDVPLFYSRCDGYANVLDDRQPPAPIPLHPAICPKCRNAAFQLRLTFEYPEAEELAAFANPDDMFTWVWVTMRCTRCHAVFRGDFAAD
C3395925	C3395925__gene_244489	F044554	FHGGLPPPCIFFHTQAYVLAGRFIPVLCASIARLFPCRTEIARCLTLDFAISRYLFLSFPFSFKTNFAQALFSSLLFVSDTRAKSILFLLFENEIAHLQGQYRFDSHRYCFSAFLVL
C3498179	C3498179__gene_284403	F051934	AAALAAVLVLSTALGERVTFRLSADIDPVQYPAQERKLAQGLKSLFRLLTVEGDVVASDGSFDARIDLGLTNAPEKTATRIRFFGLDSHWGIQSTTLGGETLMVNQLAWLEFAIKAYNHLDLPLQRVFLWLSPYAHTSAWAGLRQAIADLTAQENDGRLENTALIACAEEIARLSEDDRALYYYIEAFGLESGTDANIFDALATLPEYVEANFPDGLSIEHTENGVSWQNGEETVFSYAEADGTQVVSLHLPDLVDFSATLRRDALLFTGALSLQSDVLNAQVSFSLPVSYPVTLPFYAQIDADGMMTGDDGIHLAFEGEAQGDTITIRRIQPDHSATMMTLTVKVIQVAEGTVKYAPEDVQGTNVLSVDGPALAELMGRIGKPMVRKVTQWLAALPAELVQGAMDAMEDSGLLGTLTDAILNGEAGEY
C3512731	C3512731__gene_289981	F073573	MPTIVSFYQRFPNEAPPLNLSAFDHTGYTYAENFRRNERCYEAEQCEVTSDDGSVVLSLDVRIRPRGGEIEALPRVMLSVYSEGMLFQVRRMELRTGDTTYAILPDNVQQYTKRGDTDGGFLETMAIPLGKVGMKMLLEASDAAEARWVIQGARTAQTLPLP
C3555201	C3555201__gene_308428	F077319	MLIRNATLQMNATECACMDVRVMNGCVWEMGAALVKGLYESETDLCGDVLMPGRMLETPISAADEKALRLLCRRLYREGVRYFVADCPADALLRVQNRPERRGALPVTALPNPEPLRSGTGMPLTRWTAAGEFVGMMDEHSGD
SRS014235_WUGC_scaffold_40175	SRS014235_WUGC_scaffold_40175__gene_66921	F070133	MQLIRMNPLAFRKEPVELYSVTHTPNGSFVVIYFTEGEKSELQEMWMELFDSVGTSLLSAKLGEFDPNGEKIPHGQIILKKDRFICEYYPDITSMEVCTQTVYRYTGKRIQKPTIKKLKFGAAPYAQHVGDYMVEKQAHSEDETPFRTVKITHIASGKSKKLMIYDWSFCAFPDQDGNLLIAQQNEKGNLEIRNCNAAMQESIVELSGDFLQNENIRDAACIGQTAYMRIRLTNEKSEILLYDITQQKITDSQTLLAVDDNSYIAEIKAAGAVLLSVDGYWNRELQRQKYQINLLNEHFETSRLPLQHESCLYIFTDVEQADVTTIEMDEKSHSYFVCSYSISAGE
SRS014235_WUGC_scaffold_42668	SRS014235_WUGC_scaffold_42668__gene_71346	F056682	VVEKPHKQNNVKMQSRAEKVANQPIGQDKMYPASFGTFPLKNRSTFPIQELGKNREKQEV
SRS014235_WUGC_scaffold_47231	SRS014235_WUGC_scaffold_47231__gene_80502	F077320	MKRKGMRRRRKLVLLAVLLIMVSIAVWRIWQTPRPVVLHRQDAWLSSAEPEMVDTLPDNAFTAELPEEIDGLLLYIRDYSASGHYQIVWENVSAEAAESYLTALLDKGFTRLMGTAEDIASGVLLARGDLTLSISLSGGTLNMLMTRAEESTPTPLPEWLADW
SRS014235_WUGC_scaffold_52680	SRS014235_WUGC_scaffold_52680__gene_91926	F078003	VNEHLAFAQCLQRVLSETELTATEVARRLEMRSRNSIFRILKGKTSPQLNRRFLESFHKHMGEQLTEAQWAALNRALEMDAVGAVEYKSRQALMQLVGAFSEPISPAKVCYLDALGTEKEDSFLHYLQVLFCGALKVNALLFGCCDLGLFRQLQEAIHPVAQRVIVRIDHFIYAGEDEIVSNLVGIQPMVDQPCYHAYLVDAENCPQERLAHYRTGQMTFHVMHQDGSESTVALFLLGKNEFTATVMSTQDLWMSRKVLCDRERFSPIRLLWQLNDENSDFIVYTQQYCKMEHGAAIYYIRPDVPFQYIPLEVLYPVVREGFARMGMTREEYEPNVAALAEIHQARMTNMMRRRRPTYIVLNKAAMEEFVRTGRQSDHLHFLRNFTPKERKQILDVLVQQARENPFFHLYFAQEKLPYTMGEVALYDGRALITMSSGSGYDLRTDHRESCITHPFVLRAYKQFYMNTVVARLADTQTESLNQLEELVRRCEKMIREGQKGNAGNEQEKISGQ
SRS014235_WUGC_scaffold_61618	SRS014235_WUGC_scaffold_61618__gene_111859	F055775	MAQIAQQDNLVLEVTTAAAAALDGATKKKLIECIEGGTITDVILVTKEVEKKISHARVVSWLVDTTGDSPKYTIHIINANSGAVAAIALN
SRS014235_WUGC_scaffold_66688	SRS014235_WUGC_scaffold_66688__gene_125069	F096287	RTLTDCARKLLGNFGIILIMLTLTLPLLLDGIASLTALITFFTEGIGARGSQFTLTLLTASVMLIALNRDGLPRGVYLLRHVLLVAAAIIAINALLDAHPDGIVPLLGEGVPPLLSGIRSAWGMSWVLLLLLEFPAEEGTRRTPAMFVALLPCPVILLLLSLTIPSELTVPGRSLASRLALPTLFLQPAVRTLAQCLLMMTLFLSIAGSAQLAARFLTSSCQKPKKWVPYALIGLLTLTQLFDISRLWRVLTDFTAWSLVPGVLLLLVLTIARLCRREKA
SRS014235_WUGC_scaffold_67642	SRS014235_WUGC_scaffold_67642__gene_127666	F055739	MTEQQLREKLQFAYGNMPDATRAAFEHSLTHHRAPETHRNIGLSRMMRIVITAVLMALMLTAVGVAAARFFSVTDVHPAQDGTEGEYQAHYLALEERYDSDLLSVSVNDAVYDGSVLAFTMEMAAKTDDVLAVEVRVRGECDGKMYRFDPLDVYGGEFQSLLMLPDLGGTFDGEKYAAEGILLDENGQMPPEGKTIAWTIEIDVLKAVWQTETMPDDLYEALSEEDDVAQYIREQAEQRVITLTDAGVEDYLLEMCGAGWDEIERISKADLLLRCGGFERAETYTVAFATEGNTQYVHPELSGLRIPLDGYTAVVDYVRASFLGGCVVLHCEAPNGTALPDVWRIYRNDEQNPAGEAGWARASGYAGVPGGVVDVNQPSICLYFAPCADLTSLRIVPEGEAGFTLNLSGEKGTE
SRS014235_WUGC_scaffold_67678	SRS014235_WUGC_scaffold_67678__gene_127806	F051935	VSDWLTELKSKRLIQIVEDEIGEGWTLYQPNGREEEENFSSAANLKEMRFLPVVAQKDNQLRLLILRKQGDLWKVSEQNDRALMRDGWTLQNFSAMPYGNSDWTYIYFDFVDENQKRWNLMLNLGDGYVSSFGTISHYVEGYGTTYINMNYDRGLEFLIDAPAYSRLSYEVYPVEDYSFGVEDFDLATCPLSMQEFLVSAIVTCGEEGAGLYIMVQQDVQPIVTLADGDAIEAIPQKWELDWTIVYYQGNYLFMKTENCKMEE
SRS014235_WUGC_scaffold_69784	SRS014235_WUGC_scaffold_69784__gene_134468	F039147	MERKRIAMRARRLLILLMMLLLLPRAQAERLTLYTRPGQVDEATPFQLRPTELSICSVTRAMGGVVVLANDDNYDSLSLYFWQDGMTEMRKLGGGFYWVMSSDTMETAQESCEYAMSRVPNYRMPDLTHAISELTSDGETLYALNRINGLIFKISETKDGLQTEDVCTMANLSCLNVSYRDLETDKVYTYPASLTRMHVCGSVLAISVMQENGIKVVLVDLADGAIREIADESLEAMYEWADGELLLWRLEGSPNEISRSSGTYTLSRYSVATGEETLLSTGVPYKKRSECGAYDPYSGSYYDVRTRQIVRTTDFVQEDPVVTFPAANVNIAVTKDSIVGVNLSSVYVRSKENGDMTVLRIQSSNGASNTALQHFAEENPEVILAQETLAKSAMNAASLAARMSASADAPDILRLGLTPDTPEADGSWPLDVLMDKGWCMDLSVYPEVSDYVSRLNGIYRDAVTRDGKIYAMPIYAWSYGYFISRNVMEKLGLQESDIPTNLIDLCAFITKWNDNLTGAYAAYTPLEETESYRERVFDLMVRDWIGYCQAENIPLRFDHPVFREMMAALDAMRTDKIEQANQQVNEEISDYRECLIWTDAQAVGNFANYADAFGSRIFLPMALTPDVTTHYGIGYMTVLVVNPRTTNADLVGKLLAQVIADQEATAKCVLLADYDEPIEDSYYLIMVNDYEKTLTELRRQQENAPVWKKQGIQERINEEEASLQRYTVRERWTIAPKTIELYQQTILPMSYLRRPGILADSDAFSALVSQVHQGEISLEEFVEEADKLIEGLEQ
SRS014235_WUGC_scaffold_70118	SRS014235_WUGC_scaffold_70118__gene_135731	F078004	VPAVSRRIRSLALLSAVSEHLSSRNTDFLFRDLLFRKSSTGGLSAVAGSAALDVHMLRHTLIITIINALYRLTVDTDGMAWMRQRITERLSSLSLLRKALAAGAVTITGMLTSHHDVSLAAQTVLVIGTIFHNTF
SRS014235_WUGC_scaffold_70483	SRS014235_WUGC_scaffold_70483__gene_137022	F075480	MNKTKQEKWQRAYGDTPDSFRQRVASALPKGEESRHVAFPRRAMVLAAALVLVLTTAYAAVVTQTELVWNAGHPIENEADDRLGLLTGKAGTSGDSLTIGGVTFTVQDGIYSPETGQLFASAVISADESVQLVGVESDMEWEVRAVTPVSEKLDPSGISWAEWAEQNGKTLVPIGMEAAPTLQFLKVNGQTTDTPLIGAFLTQNPDGTVSAGFQVDLTEADTSHLKSCEVQLECRVGAFGKDGKATQWQKEILIATITFK
SRS014235_WUGC_scaffold_71218	SRS014235_WUGC_scaffold_71218__gene_140094	F089054	MLTKGKFLVSFEVPGHTKDYTEGFTEEMVIPYRTEELNPYLRYPHQEINKNHLHSKFIRQRLREILQSDITIIDIIPLP
SRS014235_WUGC_scaffold_71737	SRS014235_WUGC_scaffold_71737__gene_142319	F043945	VTSALPFEDELFFISGSQLLRVDDPEYEPEVVCNLEDIIWSEALKQSGYYGQVMLLSGGAELVLFSANEGRLYSFVPPTDDTMVRMQMVTELNYSTVPQMGWKKFPIAKDLYDVTVEQAVYDAQYGLYVIAKDKTDEYQIVWFDLDTGKGEMLEFALEDDENSHLLTDMPGIFQWSGTSSKYERTLYDGKVLTTVDLSSGEATKAVHNWVNTLTLQPIPDYDVTLGDYVTHDAYYAYAPNKDNSAMYFVHDNTVWVMEYDEENSQFSEPRGIDKLPFFAEDTMCGF
SRS014235_WUGC_scaffold_73314	SRS014235_WUGC_scaffold_73314__gene_151503	F095494	MQYHIVKGGFFVSDPKEKEVQAILQAIDYGHLPPRETQRRLLNIIQAEAARTDAPTDETKIHTCMDLLERLQGEQKPIAPARVDALRQHIAAAHQKNERKRQKRKKIMAAAACSAAAIAVAFAVSHPLLWYANWTTSDEQQHFVTSHEIAIEMLETAVADPMLPSGDTVEVQSIAALDALIGRKTGIPEMVNGQWELQHRYVNFTRSGISISLMYVNAADAQQTIVGVINLISNPQYMMLSFEQSYEGTIQQFDGLNFYITENINKPVALWQGDDKLLLFSGRTSQEEVTSLLRTIIREIGE

NMPFamsDB

NMPFamsDB

NMPFamsDB

A database of Novel Metagenome Protein Families

A database of Novel Metagenome Protein Clusters

A database of Novel Metagenome Protein Clusters

7000000736: Human stool microbial communities from NIH, USA - visit 1, subject 763678604

Overview

Ecosystem and Geography

Associated Families

Associated Scaffolds

Sequences