SEQUEST: Mining frequent subsequences using DMA strips

Tan, H.; Dillon, Tharam S.; Hadzic, Fedja; Chang, Elizabeth

dc.contributor.author	Tan, H.
dc.contributor.author	Dillon, Tharam S.
dc.contributor.author	Hadzic, Fedja
dc.contributor.author	Chang, Elizabeth
dc.date.accessioned	2017-01-30T13:34:31Z
dc.date.available	2017-01-30T13:34:31Z
dc.date.created	2008-11-12T23:32:20Z
dc.date.issued	2006
dc.identifier.citation	Tan, Henry and Dillon, Tharam and Hadzic, Fedja and Chang, Elizabeth. 2006. : SEQUEST: Mining frequent subsequences using DMA strips, in Zanasi, A. and Temis, S.A. and Brebbia, C.A. and Ebecken, N.F.F. (ed), Seventh International Conference on Data Mining and Information Engineering, Jul 11 2006, pp. 315-328. Prague, Czech Republic: WIT Press.
dc.identifier.uri	http://hdl.handle.net/20.500.11937/33029
dc.description.abstract	Sequential patterns exist in data such as DNA string databases, occurrences of recurrent illness, etc. In this study, we present an algorithm, SEQUEST, to mine frequent subsequences from sequential patterns. The challenges of mining a very large database of sequences is computationally expensive and require large memory space. SEQUEST uses a Direct Memory Access Strips (DMA-Strips) structure to efficiently generate candidate subsequences. DMA-Strips structure provides direct access to each item to be manipulated and thus is optimized for speed and space performance. In addition, the proposed technique uses a hybrid principle of frequency counting by the vertical join approach and candidate generation by structure guided method. The structure guided method is adapted from the TMG approach used for enumerating subtrees in our previous work [8]. Experiments utilizing very large databases of sequences which compare our technique with the existing technique, PLWAP [4], demonstrate the effectiveness of our proposed technique.
dc.publisher	WIT Press
dc.relation.uri	http://library.witpress.com/pages/listPapers.asp?q_bid=357
dc.subject	data mining
dc.subject	sequential strips
dc.subject	sequence
dc.subject	mining frequent subsequences
dc.subject	SEQUEST
dc.subject	DMA-strips
dc.subject	phylogenic tree
dc.title	SEQUEST: Mining frequent subsequences using DMA strips
dc.type	Conference Paper
dcterms.source.startPage	315
dcterms.source.endPage	328
dcterms.source.title	Data Mining VII: Data, Text and Web Mining and their Business Applications
dcterms.source.series	Data Mining VII: Data, Text and Web Mining and their Business Applications
dcterms.source.conference	Seventh International Conference on Data Mining and Information Engineering
dcterms.source.conference-start-date	Jul 11 2006
dcterms.source.conferencelocation	Prague, Czech Republic
dcterms.source.place	Southampton, UK
curtin.department	Centre for Extended Enterprises and Business Intelligence
curtin.identifier	EPR-1296
curtin.accessStatus	Open access
curtin.faculty	Curtin Business School

Files in this item

Name:: 20083_downloaded_stream_71.pdf
Size:: 452.0Kb
Format:: PDF

This item appears in the following Collection(s)

Curtin Research Publications

Show simple item record

SEQUEST: Mining frequent subsequences using DMA strips

Files in this item

This item appears in the following Collection(s)

Related items