ebook img

Compression of an Array of Similar Crash Test Simulation Results PDF

236 Pages·2022·3.177 MB·English
Save to my drive
Quick download
Download
Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.

Preview Compression of an Array of Similar Crash Test Simulation Results

Stefan Peter Mu¨ller Compression of an array of similar crash test simulation results λογος Stefan Peter Mu¨ller Compression of an array of similar crash test simulation results Logos Verlag Berlin λογος Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet u¨ber http://dnb.d-nb.de abrufbar. The model has been developed by The National Crash Analysis Center (NCAC) of The George Washington University under a contract with the FHWA and NHTSA of the US DOT. This work was submitted as a dissertation to the Humboldt Universit¨at zu Berlin. © Copyright Logos Verlag Berlin GmbH 2022 Alle Rechte vorbehalten. ISBN 978-3-8325-5444-6 Logos Verlag Berlin GmbH Georg-Knorr-Str. 4, Geb. 10, 12681 Berlin Tel.: +49 (0)30 / 42 85 10 90 Fax: +49 (0)30 / 42 85 10 92 http://www.logos-verlag.de To my grandfather Christoph. i Zusammenfassung In der vorliegenden Arbeit wird eine Technik zur verlustbehafteten Kompression von Scharen an ähnlichen Simulationsergebnissen beschrieben. Die entwickelten Techniken nutzen vorhandene Ähnlichkeiten zwischen Simulationsergebnissen aus, um eine effizien- tere Kompression zu erreichen als für den Fall, dass jedes Simulationsmodell für sich behandelt werden würde. Der Fokus wurde hierbei auf Crashtest Simulationsergebnisse gelegt,dieingroßerZahlinderFahrzeugentwicklunggeneriertwerden. Fürdenvorgestell- ten Kompressionsansatz, wird das Fahrzeugmodell in durch die Simulationsergebnisse definierten Bauteile zerlegt. Eine Crashtest Simulationsdatei besteht zu einem Großteil aus zeitabhängigen Knoten- und Elementvariablen. Durch die Zerlegung des Modells in Bauteile und das Wissen, welche Bauteile in welchen Simulationsergebnissen vorkom- men, können die zeitabhängigen Variablen eines Bauteils für alle Simulationsergebnisse extrahieren werden. Pro Variable und pro Bauteil wird eine Datenmatrix angelegt, in der jede Spalte einem Zeitschritt eines Simulationsergebnisses entspricht. Auf diese Ma- trizen wird die Predictive Principal Component Analysis (PPCA) Methode angewendet. Die PPCA Methode führt zunächst eine PCA auf einer Datenmatrix aus. Über einen Optimierungsprozess wird die Anzahl der Hauptkomponenten bestimmt, die zur Rekon- struktion der Daten verwendet werden sollen. Die Rekonstruktion wird im Anschluss als Vorhersage der Datenmatrix verwendet. Die PPCA Methoden können sowohl als Offline Verfahren direkt auf eine ganze Schar an Simulationsergebnissen angewandt werden, wie auch als Online Verfahren, das ein nachträgliches Hinzufügen von Simulationsergebnissen erlaubt. SowohlinderOnlinealsauchimOfflineVariantetretenmehrerefreiwählbarePa- rameterauf, dieeinenerheblichenEinflussaufdieKompressionsgüteund-geschwindigkeit haben können. Diese werden sowohl theoretisch als auch empirisch anhand von 3 Test- datensätzen untersucht und mit dem State-of-the-art Kompressionsprogramm FEMZIP verglichen. Zudem wurde die Kennzahl Lernfaktor eingeführt, mit der man Klassifizieren kann, ob ein Verfahren davon profitiert, dass nicht nur eins, sondern eine Vielzahl an Sim- ulationenkomprimiertwird. DasErgebnisderPPCAVorhersageisteinResiduen-Matrix, die die gleiche Dimension wie die ursprüngliche Datenmatrix besitzt. Zur Kompression der Residuen-Matrix wurde der induced Markov chain (iMc) Kodierer angewandt. Der iMc Kodierer ist der erste Kodierer, der die Topologie des Gitters als Nebeninforma- tion ausnutzt und gleichzeitig in Fällen eines großen Wertebereiches angewandt werden kann. Neben der Beschreibung der praktischen Umsetzung des iMc Kodierers, werden die induced Markov chains als zugrundeliegende Datenmodell hergeleitet. Auf Basis des Datenmodells kann einerseits die Entropy des Datensatzes bestimmt werden, was für die Laufzeit des Optimierungsschritt der PPCA Methoden vorteilhaft ist. Andererseits kann die Qualität der iMc Kodierung theoretisch untersucht werden. Es wird zudem gezeigt, dass die stationäre Verteilung der zugrundeliegenden Markov Kette sich für alle praktischen Anwendungsfälle nur geringfügig von der Verteilung, die durch die relativen Häufigkeiten induziert wird, unterscheidet. Des Weiteren kann die Abweichung allein auf Basis der Topologie des Gitters abgeschätzt werden. Die Evaluation des iMc Kodierers erfolgt im Vergleich zu den Kodierer Rice und zlib auf den Residuen-Matrizen, die aus den PPCA Online und Offline entstehen. Dabei erzielt die Kombination des PPCA Offline Verfahrens mit dem iMc Kodierer für alle Benchmark Datensätze die besten Ergebnisse. Für das PPCA Online-Verfahren empfehlen wir die Nutzung des Rice Kodierers. ii Abstract This thesis describes a technique for lossy compression of an array of similar simulation results. The developed techniques use similarities between simulation results to achieve a more efficient compression than if each simulation model would be treated separately. We focus on crash test simulation results, which are generated in large numbers in vehicle development. For our compression approach, we decompose the vehicle model into parts that are defined in the simulation results. A crash test simulation file consists to a large extent of time-dependent node and element variables. By decomposing the model into components and knowing which components occur in which simulation results, the time- dependent variables of a part can be extracted for all simulation results. A data matrix is created per variable and per component, in which each column corresponds to a time step of a simulation result. The Predictive Principal Component Analysis (PPCA) method is applied to these matrices. The PPCA method first executes a PCA on a data matrix. A specialized optimization process is used to determine the number of principal components to be used to reconstruct the matrix. We use the reconstruction of the dimensionality reduction as a prediction of the data matrix. The PPCA methods can be applied both as offline method directly to a whole set of simulation results and as a online method, which allows to add simulation results afterwards. In both the online and offline variants, severalfreelyselectableparametersoccurwhicharecrucialforthecompressionqualityand speed. These parameters are investigated both theoretically and empirically on the basis of 3 test data sets. The results are compared with the state-of-the-art compression tool FEMZIP. In addition, the learning factor was introduced, which can be used to classify if a procedure benefits from the fact that a large amount of simulations are compressed rather than just one. The result of the PPCA prediction is a residual matrix that has the same dimension as the original data matrix. The induced Markov chain (iMc) encoder was used to compress the residual matrix. The iMc encoder is the first encoder that uses the topology of the grid as side information and - at the same time - can be applied in cases of a big alphabet. Besides the description of the practical implementation of the iMc encoder, the induced Markov chains are derived as the underlying data model. On the one hand, the entropy of the data set can be determined on the basis of the data model, which is advantageous for the runtime of the optimization step of the PPCA methods. On the otherhand,thequalityoftheiMccodingcanbeinvestigatedtheoretically. Itisshownthat the stationary distribution of the underlying Markov chain for all practical applications differs only slightly from the distribution that is induced by the relative frequencies. In addition, the deviation can be estimated only on the basis of the topology of the grid. The evaluation of the iMc encoder is carried out in comparison to the encoders Rice and zlib on the residual matrices, which arise from an application of the PPCA Online and Offline methods on our benchmark data sets. The combination of the PPCA Offline method with the iMc encoder achieved the best results for all data sets. For the PPCA Online method, the results are not clear, as there are cases where the iMc encoder performs best as well as cases where the Rice encoder performs best. Since the Rice encoder is faster than the iMc encoder, we recommend to use the Rice encoder for the PPCA Online method. Contents 1 Introduction 1 1.1 Overview of proposed lossy compression method . . . . . . . . . . . . . . . 2 1.2 Outline . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.3 Contributions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 1.4 Danksagung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 2 Crash test simulation results 11 2.1 Calculation of crash test simulation results . . . . . . . . . . . . . . . . . . 12 2.1.1 Governing Equations . . . . . . . . . . . . . . . . . . . . . . . . . . 12 2.1.2 Contact Algorithm . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 2.1.3 Best practice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 2.2 Contents and properties . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 2.3 Simulation data management systems . . . . . . . . . . . . . . . . . . . . . 24 3 State-of-the-art compression methods 27 3.1 Information theory and its limits on data compression . . . . . . . . . . . . 28 3.1.1 Single random variables . . . . . . . . . . . . . . . . . . . . . . . . 32 3.1.2 General stochastic processes . . . . . . . . . . . . . . . . . . . . . . 34 3.1.3 Markov chains . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 3.2 Types of data compression . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 3.3 Components of data compression . . . . . . . . . . . . . . . . . . . . . . . 46 3.3.1 Quantization . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 3.3.2 Prediction and transformation . . . . . . . . . . . . . . . . . . . . . 48 3.3.3 Encoding . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 4 Dimensionality reduction methods 71 4.1 Previous work . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 4.2 Principal component analysis . . . . . . . . . . . . . . . . . . . . . . . . . 74 4.2.1 Data model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 4.2.2 Singular value decomposition . . . . . . . . . . . . . . . . . . . . . 74 4.2.3 Properties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 4.2.4 Calculation of truncated singular value decompositions . . . . . . . 76 4.3 Predictive principal component analysis . . . . . . . . . . . . . . . . . . . . 77 4.3.1 Gathering information . . . . . . . . . . . . . . . . . . . . . . . . . 79 4.3.2 Offline method . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 4.3.3 Online method . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 4.3.4 Crucial parameters . . . . . . . . . . . . . . . . . . . . . . . . . . . 90 iii iv CONTENTS 4.3.5 Segmentation into parts . . . . . . . . . . . . . . . . . . . . . . . . 99 5 Induced Markov chains for data compression 103 5.1 The induced Markov chain encoder . . . . . . . . . . . . . . . . . . . . . . 104 5.2 Time complexity of iMc encoding . . . . . . . . . . . . . . . . . . . . . . . 111 5.3 Adaptive Arithmetic coding using iMc . . . . . . . . . . . . . . . . . . . . 116 5.4 Theory of induced Markov chains . . . . . . . . . . . . . . . . . . . . . . . 119 5.5 Divergence of empirical and stationary distribution . . . . . . . . . . . . . 126 5.6 Choice of a spanning tree . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136 5.7 Combination with prediction methods . . . . . . . . . . . . . . . . . . . . . 137 5.7.1 Tree differences . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139 5.7.2 Lorenzo predictor . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140 5.7.3 Graph differences . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142 5.8 Differentiation of induced Markov chains . . . . . . . . . . . . . . . . . . . 150 5.8.1 Prediction by Partial Matching and Dynamic Markov Coding . . . 150 5.8.2 Bayesian Networks . . . . . . . . . . . . . . . . . . . . . . . . . . . 150 5.8.3 Markov Random Fields . . . . . . . . . . . . . . . . . . . . . . . . . 151 6 Evaluation 153 6.1 Methodology . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153 6.2 Benchmark data sets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155 6.2.1 Chrysler Silverado . . . . . . . . . . . . . . . . . . . . . . . . . . . 155 6.2.2 OEM 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157 6.2.3 OEM 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157 6.3 PPCA’s crucial parameters . . . . . . . . . . . . . . . . . . . . . . . . . . . 158 6.3.1 Number of principal components . . . . . . . . . . . . . . . . . . . 158 6.3.2 Internal Precision and amendment steps . . . . . . . . . . . . . . . 160 6.3.3 Small parts threshold . . . . . . . . . . . . . . . . . . . . . . . . . . 162 6.4 Compression factors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163 6.4.1 Silverado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165 6.4.2 OEM 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172 6.4.3 OEM 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175 6.5 Run times . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178 6.6 Application fields . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182 7 Conclusion 187 7.1 Summary . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187 7.2 Outlook and future work . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189 7.2.1 Runtime . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189 7.2.2 Compression factor . . . . . . . . . . . . . . . . . . . . . . . . . . . 190 A Basic definitions and theorems I A.1 Probability theory . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . I A.1.1 Definitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . I A.1.2 Statements and theorems . . . . . . . . . . . . . . . . . . . . . . . . II B Ergodicity of Markov processes VII

See more

The list of books you might like

Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.