Please use this identifier to cite or link to this item: http://dx.doi.org/10.25819/ubsi/464
Files in This Item:
File Description SizeFormat
Dissertation_Moses_Ganardi.pdf1,73 MBAdobe PDFThumbnail
View/Open
Dokument Type: Doctoral Thesis
Title: Language recognition in the sliding window model
Other Titles: Formale Sprachen im Sliding-Window-Modell
Authors: Ganardi, Moses 
Institute: Institut für Theoretische Informatik 
Free keywords: streaming algorithms, sliding windows, formal languages and automata theory
Dewey Decimal Classification: 004 Informatik
GHBS-Clases: TVL
TVVK
TUH
Issue Date: 2019
Publish Date: 2019
Abstract: 
In many streaming applications recent elements in the stream are considered more important than older elements. In the sliding window model we are given an unbounded stream of elements and the goal is to maintain a data structure which allows performing a certain query (e.g. computing a numerical quantity or verifying a property) on the set or sequence of the last n elements. The number n is called the window size, which can be either a fixed number or controlled online. The challenge is to devise streaming algorithms which avoid maintaining the window explicitly using Θ(n) space.

This thesis considers the language recognition problem in the sliding window problem: Given a formal language (in other words, a property) and a stream of symbols, maintain a small data structure which allows testing whether the current window, i.e. the suffix of length n, belongs to the language (satisfies the property). The main question that we aim to answer is: Which languages admit sliding window algorithms using sublinear space?

The first main result is a space trichotomy (constant, logarithmic, linear) for the space complexity
of regular languages in the fixed- and the variable-size sliding window model, together with language-theoretic descriptions of the space classes. We also study the uniform setting where the regular language is considered as part of the input. On this basis we extend these results in various directions: (i) randomness, (ii) approximation, and (iii) subclasses of context-free languages. We prove a quatrochotomy for the randomized space complexity of regular languages. Concerning approximation, we present a constant-space sliding window property tester for every regular language, which distinguishes between words in the language and words that have large Hamming distance from the language. Finally, we give partial results on context-free languages over sliding windows and extend the space trichotomy for regular languages to the class of visibly pushdown languages.

In vielen Streaminganwendungen sind neue Datenelemente wichtiger als ältere Elemente. Im Sliding-Window-Modell ist die Eingabe ein unbeschränkter Strom von Elementen und das Ziel ist es eine Datenstruktur aufrechtzuerhalten, die es erlaubt gewisse Anfragen (Berechnung von Statistiken oder Überprüfen einer Eigenschaft) an die Menge oder die Folge der letzten n Elemente auszuführen. Die Zahl n ist die sogenannte Fensterlänge, die entweder fixiert ist oder online kontrolliert wird. Die Herausforderung besteht darin Streamingalgorithmen zu entwerfen, die die explizite Speicherung des Fensters in Θ(n) Bits vermeidet.

Diese Arbeit befasst sich mit dem Membershipproblem für formale Sprachen im Sliding-Window-Modell: Gegeben eine formale Sprache (in anderen Worten: eine Eigenschaft) und ein Strom von Symbolen, gesucht ist eine kompakte Datenstruktur, die über dem Strom aufrechterhalten werden kann und es erlaubt zu testen, ob das aktuelle Fenster zur Sprache gehört bzw. die Eigenschaft erfüllt. Die Hauptfrage, die wir uns stellen, lautet: Für welche Sprachen gibt es einen Sliding-Window-Algorithmus mit sublinearem Platz?

Das erste Hauptergebnis ist eine Trichotomie (konstant, logarithmisch, linear) für die Platzkomplexität von regulären Sprachen in dem Sliding-Window-Modell mit fester und variable Fensterlänge. Außerdem werden die Platzklassen sprachentheoretisch beschrieben. Wir betrachten auch das uniforme Problem, bei dem die reguläre Sprache Teil der Eingabe ist. Anschließend werden diese Ergebnisse in verschiedene Richtungen erweitert: (i) Randomisierung, (ii) Approximation und (iii) Teilklassen von kontextfreien Sprachen. Wir beweisen eine Quatrochotomie für die randomisierte Platzkomplexität von regulären Sprachen. Als einen möglichen Approximationsansatz präsentieren wir einen Sliding-Window-Property-Tester mit konstantem Platz für jede reguläre Sprache, der Wörter in der Sprache von Wörtern mit großer Hammingdistanz von der Sprache unterscheidet. Zuletzt untersuchen wir kontextfreie Sprachen im Sliding-Window-Modell und erweitern die Platztrichotomie für reguläre Sprachen auf die Teilklasse der Visibly-Pushdown-Sprachen.
DOI: http://dx.doi.org/10.25819/ubsi/464
URN: urn:nbn:de:hbz:467-15234
URI: https://dspace.ub.uni-siegen.de/handle/ubsi/1523
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Appears in Collections:Hochschulschriften

This item is protected by original copyright

Show full item record

Page view(s)

354
checked on Nov 30, 2020

Download(s)

185
checked on Nov 30, 2020

Google ScholarTM

Check

Altmetric


This item is licensed under a Creative Commons License Creative Commons