Sample 7000000624

Basic Information
IMG/M Taxon OID	7000000624 Open in IMG/M
GOLD Reference (Study \| Sequencing Project \| Analysis Project)	Gs0063646 \| Gp0053199 \| Ga0030563
Sample Name	Human stool microbial communities from NIH, USA - visit 2, subject 159571453
Sequencing Status	Permanent Draft
Sequencing Center	Baylor College of Medicine, J. Craig Venter Institute (JCVI), Washington University in St. Louis
Published?	N
Use Policy	Open

Dataset Contents
Total Genome Size	201626213
Sequencing Scaffolds	13
Novel Protein Genes	24
Associated Families	23

Dataset Phylogeny
Taxonomy Groups	Number of Scaffolds
All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Clostridia → Eubacteriales	6
All Organisms → cellular organisms → Bacteria	4
Not Available	1
All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Erysipelotrichia → Erysipelotrichales → Erysipelotrichaceae → Holdemania → Holdemania massiliensis	1
All Organisms → cellular organisms → Bacteria → FCB group → Bacteroidetes/Chlorobi group → Bacteroidetes → Flavobacteriia → Flavobacteriales → unclassified Flavobacteriales → Flavobacteriales bacterium	1

Ecosystem Assignment (GOLD)
Name	Human Microbial Communities From The National Institute Of Health, Usa, Hmp Production Phase
Type	Host-Associated
Taxonomy	Host-Associated → Human → Digestive System → Large Intestine → Fecal → Human → Human Microbial Communities From The National Institute Of Health, Usa, Hmp Production Phase

Alternative Ecosystem Assignments
Environment Ontology (ENVO)	Unclassified
Earth Microbiome Project Ontology (EMPO)	Host-associated → Animal → Animal surface

Location Information
Location	National Institutes of Health, USA
Coordinates	Lat. (^o)	N/A	Long. (^o)	N/A	Alt. (m)	N/A	Depth (m)	N/A
Location on Map

Zoom:	Powered by OpenStreetMap^©

Family	Category	Number of Sequences	3D Structure?
F042095	Metagenome	159	N
F042910	Metagenome	157	N
F047755	Metagenome	149	Y
F058555	Metagenome	135	N
F059982	Metagenome	133	N
F064725	Metagenome	128	N
F068856	Metagenome	124	N
F073573	Metagenome	120	N
F075480	Metagenome	119	N
F075481	Metagenome	119	N

Scaffold	Taxonomy	Length	IMG/M Link
C3086825	All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Clostridia → Eubacteriales	672	Open in IMG/M
C3110754	All Organisms → cellular organisms → Bacteria	768	Open in IMG/M
C3148798	All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Clostridia → Eubacteriales	1011	Open in IMG/M
C3194670	All Organisms → cellular organisms → Bacteria	1691	Open in IMG/M
C3206497	All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Clostridia → Eubacteriales	2084	Open in IMG/M
C3210574	All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Clostridia → Eubacteriales	2265	Open in IMG/M
C3215078	All Organisms → cellular organisms → Bacteria	2523	Open in IMG/M
C3223416	All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Clostridia → Eubacteriales	3237	Open in IMG/M
SRS024435_LANL_scaffold_20298	All Organisms → cellular organisms → Bacteria	60235	Open in IMG/M
SRS024435_LANL_scaffold_23226	Not Available	35169	Open in IMG/M

Sequences

Scaffold ID	Protein ID	Family	Sequence
C3086825	C3086825__gene_213343	F087213	TAESTDAVSGAPLDNDIEIVYKEHFDDMVTRYADELTEAELLVSADVYDAIGMIRFDSEDSLAARQRIYGIASADDLHAILTGYFDPNDAAYTADTALDAHLQAILAACGLNPEDYDISVIRNLSGMPEPITGTNWYCTLIRKGIEVAEDETNPYDMVIVLYGDEMTVGAFVLNPEV
C3110754	C3110754__gene_225586	F087336	RGMVAELEQVPKAFRAAGNQRRAAAKERIKDDAIGHGRVSDRILAEIEDNHMRERDTKIGLAEQRQVAFLGIAFQILPPTSKQKRAPQEVNSQSALSESNQLINP
C3146335	C3146335__gene_244639	F078004	LPPNPITCFIIRILQGFVKPDLMVLFPVCFLFFCKSSTGRLSAVAGSATLDIHMIRHALVIAVINTFYRLTVDADRMAWMRQGIAERFSSLSLLRKAFTAGSVTVAGVLATHHDVSLATQTVLIIGTIFHNAF
C3148798	C3148798__gene_245958	F101191	MLLCGFDLDKALSSRDPLDCMAEAVADDTKRIGTTCGGGIFRAVPREFDPESGSHRLPFAGSIRLIDWRVTLSGTMLDVTPENLARLLPSDTEITERVTTLTPKQTRKPLSRLCWIGTTSRGLLVIELRNPLCISGASLTSVPDGAGRLPFTFLAQNDRPGDVNLPARLYWWKEETHDAA
C3194670	C3194670__gene_273477	F047755	DIKDKLRLAICMSQSKWSGLIYNTKENYKKFDSMLKNIDEEYMTTLIDFSKYKLIMFAMAKLMEMETTEQNKVALYLFNYIEK
C3206497	C3206497__gene_281558	F042910	LRRQREQLSLRVRFLIEEYDIAARHQLLHLVAAWAEAGGVLTLHEDGKRVLRVVCTQYPTMSTLNWLETLSLVFTAFSCPYWEDAAETSFLMPNTSDAPSKLLAVPGDAPETPLNLLIRNIGDAAITALTISAAGKISFQGLTIAPGAAIRIHHDAGVFAAEMVSDDSTVSILPYRTPESADDLLLRPGVLNEIRVEAGSAAFVSGRCKGRYC
C3210574	C3210574__gene_284599	F073573	MLRGQRWSHLTKNTPKEVFTMPTIVSFYQRFPNEAPPLNLSAFDHTGYTYAENFRRNERYYEAEQCEVTSDDGSVVLSLDVRIRPRGGEIEALPRVMLSVYSEGMPFQVRRMELRTGDTTYAILPDNVQQYTMRGDTDGGFLETMAIPLGKVGMKMLLEASDAAEAR
C3215078	C3215078__gene_287984	F059982	MTMRRMTRLLCLMLLFSLITFSCPLAEETDAPTGTPAPTPMLTAVPESALAPFNVVLPEDAHVEMAEGRITLVRGDSRVVAMVISRVPDEDPAAALPILMQDFDPKTSETMDFDAQPGFCILGGVVNDAFGDGEDKITLMVLADSGELLILSGYNLARDHHALYLFLTELLENASMDGAAVYVAEDAAATASPEV
C3223416	C3223416__gene_294916	F102166	MEETWRISPEMRAFLMKKLFSLLLVLALALVPTLSLADDDAACQNLYNMLLDELKSVDLEMTADEESYRIYLGYALDKNSLGDADVIFDAYSDAVTINVSYSNPLDEALVPQVISFFNRVNSTLYVGKLMVIKSDNMWYAAYEIFLSVDPENITDWDRNNVLAYTALALDTMEEMVDYITEIANGESADNVFAMWQADIGAV
SRS024435_LANL_scaffold_20298	SRS024435_LANL_scaffold_20298__gene_48269	F075481	MKRLRISLKAVFCLGLSLSLSSCGSRRQVSETSIDSRLISRIETMIDEVMDRKIVEIKTSDLNADIVITKRKFDTDKDVDPATGERPVSSQTDTHIVIGRRDSTVTADSVGVNKKRNDIKDLDNKIDIKSKDVDDKKESKWPTVWIVCGILMILLVLVYILKRIRIL
SRS024435_LANL_scaffold_20298	SRS024435_LANL_scaffold_20298__gene_48273	F042095	MAKTLYKYEALSNKFMWFTTWDRALRNYYTDDYNYVPDPVVGNPFNTFVEFRSRKPGMANVDWGDGIKEQFPMTKVQGHDSYHIIFRSLAIQHKKNPNTTWWFRKEDGSQYVPVDNHAYADGRRDVQRAVSIDFTCDIYYVNINTCKMTAFPIVDIPDLESLIVSHTRYVNDGIPVDRLSRSKKLIYINLSDIGQRMTEMPEAITSKTEVDHLNMFNILDLRDIESSGIRNIKNMKNLQALDLSSCYLDRYIKEFNDLPKLTSLNITSGPLDMCNYFDINTLPSFEVDKINPNIAYFSFLEDWKNGERRTGWNDDNMSGRGLDHIANFNVSHSNGIRVDKLPDYIYEMRSITRFGMNCSTHSQKRSDDFVNSFYDLVVGWDQITMASVAKDGERNQFYGLAVSMYSSQYPDENQRPSGTEQASEGFVKGQSNGSPATPMEKIYVLKNNYAQIWTIKPE
SRS024435_LANL_scaffold_20298	SRS024435_LANL_scaffold_20298__gene_48287	F093883	MEEDKDIKKEIRDYLKEEADTHIRHWIAIKRESKRLYSDIEDRTKKIALKSPSLIKEEDFVVLHEMTHKIQMLNIEAVKVNSRLMFIIQLATSFGMDLDLDTTYASTAKSIIEDRTSGFVFYDDKERLRYADKELEDMFHDMSVTEVSKIGVVQSYELLMKQYNEFKDMKANATGKTKAD
SRS024435_LANL_scaffold_20298	SRS024435_LANL_scaffold_20298__gene_48294	F058555	MKLVYSQKIKSTMGTKIGILHIMKSNFDKIITERYTPRNIQAKKDELGCVKLPAGSLICPVDFKPVTNKEGKKVTAIKYSLKHEEYHGSGIQISDECKMAMIYLIIINVFKHVFLRNRMHGGNRDQIEINTNDFIDILSDGCAYFCYRHVLRDSHEDMNYQLISLKAWAEGEIMIALSDIIKYKHKASKTPRIKDMFVKKGESVYTCLDKSLDSNTRRRMANKSRKLNRVKMLSKIIFSARNRNINKIYKVTKKRTVKFNVSYLMDRLNIKLSKEGMMLISQRTVYRMIKDVLSMCCKTISDLYDEVKKNNGIINTKDRKNVNIGHLRLSYRGTIMHIIIAEDYIRDVFLGVKGAEMSKA
SRS024435_LANL_scaffold_20298	SRS024435_LANL_scaffold_20298__gene_48310	F083452	MSGRVKIKSKDKDKKPKIDVFKIIENRFKNMNELRDMIDMDPKKGLVRIRDGAGFREVERGGCLHRNYLNLLEEELGAKLSIDLIERYIKR
SRS024435_LANL_scaffold_23226	SRS024435_LANL_scaffold_23226__gene_55085	F077313	MGKYVIKRKIPKYQEAGEVTPIMPGNVVGLQGIGVEPLVSSTRIGFDIQQPDINTIDTSDLNAIVDSNKKVDESGSTDVFDFTTIPYYGADDIGSRFTQMGRGIGRMRSEGYGDLSTGAKTANVVGTVMSGIGGVLGLARNVFSGMASEQGTRTNIRLAQEREARQRRQSQMRYKDGGGVYLGPNNRFDSGSLTGEYLYPLPKSMEDQANVEVEKGEYVTQPGEAPMEAMGQKHADGGTPVSLEEGTKVITDDTTIESDFAKYIRDTYGIKATPKDTYATLMDRYKAKIGLKSAYDDQKKALEKLKKNDKIDDENTKRLNASVLSKAINDSNDTVNGLEGRFTDFANVIYKEQEDRKMKKDEDTYFAKGGEIDNIISRSMKEYGLTEEDIAEAKKELLKKVAGIRQKMEIGGTSLFGRKLTFRPIENRFNNDPNYFGYQRQGTDGSYGGINTDERLNYYKTFNPVAYDAYMGASEGTRARALQDAIYGQTSSWMGLATAENPIIANAEALRDYTTLVSFGGEDSQGNYPEDKKAAYHDRMRDNKLGLFTTSRPMIGLDVVTEEQHKALNDAGITHFSQLFSDKNKDVVNKILGEDMLKMQALRSMKGMEGLDFILDPHKVAPGSMDIGDVENPDVKLDMPELIDSNTLPKTNTNAGKSNGGNGGRNIVGGGLDFPEVFRMTPGAVTTEGLERHYAPTVDPVLRSADQYMVEANRAFQSQLDQMGNVPDSQRGALSSNLQAIMSSNIGKYINEVEQGNVAQRTWADNVNARTWTDTYDKNIAQRQGYQSRILQALANTDENWARYFDSVNDEIQQKWNTATTMNTLRSIFGDVKIGPNGQLIADPQGDILSYRRLYPAQEVTKGKKG
SRS024435_LANL_scaffold_23226	SRS024435_LANL_scaffold_23226__gene_55094	F064725	MGLQAVEVFFVIQLAREGRLDFFCITDSNTYLCAKDLNMTIKGLLAEIKADLHKYDDSGAIDTSSVYRWAEIALKRFGGVIAVMSEAVVKTSNKQAVLPSDFFDMLDAYRCEPLVCEIPGGDKAKADLQHEIGWVERTERGFRWNSCTECCKEEFEKTITEKIYIGSHEVRFHYHHPVRLSIGRGLRRDCAADKYRDKYAWDNYDITISGNTMYTGFDGFIYIIYRATPKDDDGLPYIPETALGYLEDYVETYIKMKIFENAAVNGLIQGAGDAYKLYAQQEPGKFARAMKELKMSMITLNDYRELAEDNRRRMLSHERMWPNAFNKYIKLI
SRS024435_LANL_scaffold_28092	SRS024435_LANL_scaffold_28092__gene_67829	F075480	GDTPDSFRQRVAASLPKGEESRHVAFPRRAMVLAAALVLVLTTAYAAVVTHTELVWNAGHPIENEADDRLGLLTGKAGTSGDSLTIGGVTFTVQDGIYSPETGQLFASAVISADESVQLVAVEADMEHEVRLTTPVDAKLDPSGISWAEWAEQNGKTLVPIGMEAAPTLQFLKVNGQTTDTPLIGAFLTQNPDGTVSAGFQVDLTEADTSHLKSCEVQLECRVGAFGKDGKATQWQKEILTATITFK
SRS024435_LANL_scaffold_31519	SRS024435_LANL_scaffold_31519__gene_78032	F068856	LVGMALAEETPDTALGDWYALNTENEAICLTLREDGTFCYDSREGTWCKTTDGEYWLTYNIHDLPEVMERMVNSQAAEQDLTALLTETGLDVYYGSTAKGVVAHMVRDAEELQNVRTPKTDTPLEAFAGTWTMETVFAGAMEMTYTLDKGERLAFCTIDGLTMLPGAALGNFTEGTSYPMTLEDGKLHTTILMQMTEEETLDFDLTFFQTADGSLYATLRLNDVPDNPTTMFLLVPMEKE
SRS024435_LANL_scaffold_7741	SRS024435_LANL_scaffold_7741__gene_19379	F078004	SRRIRSLALLSAVSEHLSSRNTDFLFRDLLFRKSSTGGLSAVAGSAALDVHMLRHTLIITIINALYRLTVDTDGMAWMRQRITERLSSLSLLRKALAAGAVTITGMLTSHHDVSLAAQTVLVIGTIFHNTF
SRS024435_LANL_scaffold_8137	SRS024435_LANL_scaffold_8137__gene_20442	F080673	MDEIIKLQDEILSYLRNNITKDEAYYILTTDKDMIEVLISDKKDGSKRIKILDMEYTIEKDDMLLLFDTDGVIDECLLVASYIGVNMYFRRQDVNAILYNINREKVMKYPYIAIQLDNIQTIEKRRVIFDITGHRMDDNKERIDFMFIYFMARLCV
SRS024435_LANL_scaffold_8137	SRS024435_LANL_scaffold_8137__gene_20447	F078006	MEDNILKRAAAELKEAGCRVFAWQDDFYNRSWDKGDYTMLYYAFPDSPNIGYLSHGEYGMSVAYSRAYIPSCGSGSGCCVKEEATFDLATALDVLNGPLPRWCRSYGVYPKQYDNIDKWYNSDNYNKKLFKEI
SRS024435_LANL_scaffold_8137	SRS024435_LANL_scaffold_8137__gene_20448	F085718	MVIEFDFEIYKNGDYDKVYLRNGKEARVLCDNGKGNSPIVVMIEDDKADDYIILRYNETGRRNINGQSGLDLMLSVKEREPELWVVVISYMDNKDKRQKMVLPNFFSRNIRGNIYLQGSSKSSVSYYVDKLEEDGCFDELCEKIRVKRDRIYNMEIISLSDDETAV
SRS024435_LANL_scaffold_8137	SRS024435_LANL_scaffold_8137__gene_20463	F078005	MEKSEFVKNLEKIIDMVKTEDDGFEYGGKVIFYKEDDSNYEVSVMNIEMNLGVEANVMAGMDDMDFTCLMCEVYKQKAVKAIMMEKDDDEDN
SRS024435_LANL_scaffold_8137	SRS024435_LANL_scaffold_8137__gene_20491	F076653	MTIRDKYFGWKDIFFDRFVHCCNEKSGQPQGSNIPLAKINFDNKTGYVEDGTINIAELLQYLWINNKVYGCEYAPIDISSVLQTLIRLTENAKFIFDDQPGIHDMIPYRGFFLRDDFLPGKDYSLDLDKIVSGMGGWYGEDEDPCYSMFVSQDQIWNLNPILKVLADEGSPLAKKLGYEINSYVSDNGYTIYNPYLSWINHYYHYCPTFNEDKLKPWDRVEDRKNKFKMTDKVKRGANNWYYSGGTISCVDNFMGKRYRKNLRTFIYRGIVFFLDRIWHTPLFEKMGVKMKYNAYYCYAATSGIWYNKGFKKRLAKRFNESLRGGGDLFGANLACMVCDRRDIDWEALRLWLDKYDEPTDKGMVNSPIQFMYLYLYYAFNK

Showing 1 to 24 of 24 entries

NMPFamsDB

NMPFamsDB

NMPFamsDB

A database of Novel Metagenome Protein Families

A database of Novel Metagenome Protein Clusters

A database of Novel Metagenome Protein Clusters

7000000624: Human stool microbial communities from NIH, USA - visit 2, subject 159571453

Overview

Ecosystem and Geography

Associated Families

Associated Scaffolds

Sequences