upstream/mercurial-mirror Files · contrib/python-zstandard/tests/test_train_dictionary.py

bdiff: write a native version of splitnewlines...

bdiff: write a native version of splitnewlines ./hg perfunidiff mercurial/manifest.py 0 --count 500 --profile before: ! wall 0.309280 comb 0.350000 user 0.290000 sys 0.060000 (best of 32) ./hg perfunidiff mercurial/manifest.py 0 --count 500 --profile after: ! wall 0.241572 comb 0.260000 user 0.240000 sys 0.020000 (best of 39) so it's about 20% faster. I hate Python. I wish we could usefully write this in Rust, but it doesn't look like that's realistic without using the cpython crate, which I'd still like to avoid. Differential Revision: https://phab.mercurial-scm.org/D1973

Gregory Szorc - - Load All Authors

File last commit:

r31796:e0dc4053 default


                r36163:29dd37a4

default

Download file

             test_train_dictionary.py
        
                    110 lines
            
             | 2.9 KiB
            
                | text/x-python
            
             |
                PythonLexer
            
             / contrib / python-zstandard / tests / test_train_dictionary.py
          
                    History
                
                 |
                  Annotation
                 | Raw
                 |Copy content
                 |Copy permalink

      import sys

      try:

          import unittest2 as unittest

      except ImportError:

          import unittest

      import zstd

      from . common import (

          make_cffi,

      )

      if sys.version_info[0] >= 3:

          int_type = int

      else:

          int_type = long

      @make_cffi

      class TestTrainDictionary(unittest.TestCase):

          def test_no_args(self):

              with self.assertRaises(TypeError):

                  zstd.train_dictionary()

          def test_bad_args(self):

              with self.assertRaises(TypeError):

                  zstd.train_dictionary(8192, u'foo')

              with self.assertRaises(ValueError):

                  zstd.train_dictionary(8192, [u'foo'])

          def test_basic(self):

              samples = []

              for i in range(128):

                  samples.append(b'foo' * 64)

                  samples.append(b'bar' * 64)

                  samples.append(b'foobar' * 64)

                  samples.append(b'baz' * 64)

                  samples.append(b'foobaz' * 64)

                  samples.append(b'bazfoo' * 64)

              d = zstd.train_dictionary(8192, samples)

              self.assertLessEqual(len(d), 8192)

              dict_id = d.dict_id()

              self.assertIsInstance(dict_id, int_type)

              data = d.as_bytes()

              self.assertEqual(data[0:4], b'\x37\xa4\x30\xec')

          def test_set_dict_id(self):

              samples = []

              for i in range(128):

                  samples.append(b'foo' * 64)

                  samples.append(b'foobar' * 64)

              d = zstd.train_dictionary(8192, samples, dict_id=42)

              self.assertEqual(d.dict_id(), 42)

      @make_cffi

      class TestTrainCoverDictionary(unittest.TestCase):

          def test_no_args(self):

              with self.assertRaises(TypeError):

                  zstd.train_cover_dictionary()

          def test_bad_args(self):

              with self.assertRaises(TypeError):

                  zstd.train_cover_dictionary(8192, u'foo')

              with self.assertRaises(ValueError):

                  zstd.train_cover_dictionary(8192, [u'foo'])

          def test_basic(self):

              samples = []

              for i in range(128):

                  samples.append(b'foo' * 64)

                  samples.append(b'foobar' * 64)

              d = zstd.train_cover_dictionary(8192, samples, k=64, d=16)

              self.assertIsInstance(d.dict_id(), int_type)

              data = d.as_bytes()

              self.assertEqual(data[0:4], b'\x37\xa4\x30\xec')

              self.assertEqual(d.k, 64)

              self.assertEqual(d.d, 16)

          def test_set_dict_id(self):

              samples = []

              for i in range(128):

                  samples.append(b'foo' * 64)

                  samples.append(b'foobar' * 64)

              d = zstd.train_cover_dictionary(8192, samples, k=64, d=16,

                                              dict_id=42)

              self.assertEqual(d.dict_id(), 42)

          def test_optimize(self):

              samples = []

              for i in range(128):

                  samples.append(b'foo' * 64)

                  samples.append(b'foobar' * 64)

              d = zstd.train_cover_dictionary(8192, samples, optimize=True,

                                              threads=-1, steps=1, d=16)

              self.assertEqual(d.k, 16)

              self.assertEqual(d.d, 16)

	Site-wide shortcuts
/	Use quick search box
g h	Goto home page
g g	Goto my private gists page
g G	Goto my public gists page
g 0-9	Goto bookmarked items from 0-9
n r	New repository page
n g	New gist page

	Repositories
g s	Goto summary page
g c	Goto changelog page
g f	Goto files page
g F	Goto files page with file search activated
g p	Goto pull requests page
g o	Goto repository settings
g O	Goto repository access permissions settings
t s	Toggle sidebar on some pages

				import sys

				try:
				import unittest2 as unittest
				except ImportError:
				import unittest

				import zstd

				from . common import (
				make_cffi,
				)

				if sys.version_info[0] >= 3:
				int_type = int
				else:
				int_type = long


				@make_cffi
				class TestTrainDictionary(unittest.TestCase):
				def test_no_args(self):
				with self.assertRaises(TypeError):
				zstd.train_dictionary()

				def test_bad_args(self):
				with self.assertRaises(TypeError):
				zstd.train_dictionary(8192, u'foo')

				with self.assertRaises(ValueError):
				zstd.train_dictionary(8192, [u'foo'])

				def test_basic(self):
				samples = []
				for i in range(128):
				samples.append(b'foo' * 64)
				samples.append(b'bar' * 64)
				samples.append(b'foobar' * 64)
				samples.append(b'baz' * 64)
				samples.append(b'foobaz' * 64)
				samples.append(b'bazfoo' * 64)

				d = zstd.train_dictionary(8192, samples)
				self.assertLessEqual(len(d), 8192)

				dict_id = d.dict_id()
				self.assertIsInstance(dict_id, int_type)

				data = d.as_bytes()
				self.assertEqual(data[0:4], b'\x37\xa4\x30\xec')

				def test_set_dict_id(self):
				samples = []
				for i in range(128):
				samples.append(b'foo' * 64)
				samples.append(b'foobar' * 64)

				d = zstd.train_dictionary(8192, samples, dict_id=42)
				self.assertEqual(d.dict_id(), 42)


				@make_cffi
				class TestTrainCoverDictionary(unittest.TestCase):
				def test_no_args(self):
				with self.assertRaises(TypeError):
				zstd.train_cover_dictionary()

				def test_bad_args(self):
				with self.assertRaises(TypeError):
				zstd.train_cover_dictionary(8192, u'foo')

				with self.assertRaises(ValueError):
				zstd.train_cover_dictionary(8192, [u'foo'])

				def test_basic(self):
				samples = []
				for i in range(128):
				samples.append(b'foo' * 64)
				samples.append(b'foobar' * 64)

				d = zstd.train_cover_dictionary(8192, samples, k=64, d=16)
				self.assertIsInstance(d.dict_id(), int_type)

				data = d.as_bytes()
				self.assertEqual(data[0:4], b'\x37\xa4\x30\xec')

				self.assertEqual(d.k, 64)
				self.assertEqual(d.d, 16)

				def test_set_dict_id(self):
				samples = []
				for i in range(128):
				samples.append(b'foo' * 64)
				samples.append(b'foobar' * 64)

				d = zstd.train_cover_dictionary(8192, samples, k=64, d=16,
				dict_id=42)
				self.assertEqual(d.dict_id(), 42)

				def test_optimize(self):
				samples = []
				for i in range(128):
				samples.append(b'foo' * 64)
				samples.append(b'foobar' * 64)

				d = zstd.train_cover_dictionary(8192, samples, optimize=True,
				threads=-1, steps=1, d=16)

				self.assertEqual(d.k, 16)
				self.assertEqual(d.d, 16)