u/pc/rhodecode-enterprise-ce-fork-pc Commit - r3444:e5ce0962

diffs: fixed case of bogus files diff rendering...

ergo -

r3444:e5ce0962 default

parent child

rhodecode/lib/codeblocks.py

0 +22 -12

                  lexer = lexer or get_lexer_for_filenode(filenode)
                  log.debug('Generating file node pygment tokens for %s, %s, org_lexer:%s',
                            lexer, filenode, org_lexer)
-                 tokens = tokenize_string(filenode.content, lexer)
-                 lines = split_token_stream(tokens)
+                 content = filenode.content
+                 tokens = tokenize_string(content, lexer)
+                 lines = split_token_stream(tokens, content)
                  rv = list(lines)
                  return rv
                      yield pygment_token_class(token_type), token_text
-             def split_token_stream(tokens):
+             def split_token_stream(tokens, content):
                  """
                  Take a list of (TokenType, text) tuples and split them by a string
                   (TEXT, 'more'), (TEXT, 'text')]
                  """
-                 buffer = []
+                 token_buffer = []
                  for token_class, token_text in tokens:
                      parts = token_text.split('\n')
                      for part in parts[:-1]:
-                         buffer.append((token_class, part))
-                         yield buffer
-                         buffer = []
+                         token_buffer.append((token_class, part))
+                         yield token_buffer
+                         token_buffer = []
+                     token_buffer.append((token_class, parts[-1]))
-                     buffer.append((token_class, parts[-1]))
-                 if buffer:
-                     yield buffer
+                 if token_buffer:
+                     yield token_buffer
+                 elif content:
+                     # this is a special case, we have the content, but tokenization didn't produce
+                     # any results. THis can happen if know file extensions like .css have some bogus
+                     # unicode content without any newline characters
+                     yield [(pygment_token_class(Token.Text), content)]
              def filenode_as_annotated_lines_tokens(filenode):
                      if filenode not in self.highlighted_filenodes:
                          tokenized_lines = filenode_as_lines_tokens(filenode, lexer)
                          self.highlighted_filenodes[filenode] = tokenized_lines
-                     return self.highlighted_filenodes[filenode][line_number - 1]
+                     try:
+                         return self.highlighted_filenodes[filenode][line_number - 1]
+                     except Exception:
+                         return [('', u'rhodecode diff rendering error')]
                  def action_to_op(self, action):
                      return {

rhodecode/tests/lib/test_codeblocks.py

0 +33 -10

              class TestSplitTokenStream(object):
                  def test_split_token_stream(self):
-                     lines = list(split_token_stream(
-                         [('type1', 'some\ntext'), ('type2', 'more\n')]))
+                     tokens = [('type1', 'some\ntext'), ('type2', 'more\n')]
+                     content = [x + y for x, y in tokens]
+                     lines = list(split_token_stream(tokens, content))
                      assert lines == [
                          [('type1', u'some')],
                      ]
                  def test_split_token_stream_single(self):
-                     lines = list(split_token_stream(
-                         [('type1', '\n')]))
+                     tokens = [('type1', '\n')]
+                     content = [x + y for x, y in tokens]
+                     lines = list(split_token_stream(tokens, content))
                      assert lines == [
                          [('type1', '')],
                          [('type1', '')],
                      ]
                  def test_split_token_stream_single_repeat(self):
-                     lines = list(split_token_stream(
-                         [('type1', '\n\n\n')]))
+                     tokens = [('type1', '\n\n\n')]
+                     content = [x + y for x, y in tokens]
+                     lines = list(split_token_stream(tokens, content))
                      assert lines == [
                          [('type1', '')],
                          [('type1', '')],
                      ]
                  def test_split_token_stream_multiple_repeat(self):
-                     lines = list(split_token_stream(
-                         [('type1', '\n\n'), ('type2', '\n\n')]))
+                     tokens = [('type1', '\n\n'), ('type2', '\n\n')]
+                     content = [x + y for x, y in tokens]
+                     lines = list(split_token_stream(tokens, content))
                      assert lines == [
                          [('type1', '')],
                          [('type1', '')],
                          [('type2', '')],
                      ]
+                 def test_no_tokens_by_content(self):
+                     tokens = []
+                     content = u'\ufeff'
+                     lines = list(split_token_stream(tokens, content))
+                     assert lines == [
+                         [('', content)],
+                     ]
+                 def test_no_tokens_by_valid_content(self):
+                     from pygments.lexers.css import CssLexer
+                     content = u'\ufeff table.dataTable'
+                     tokens = tokenize_string(content, CssLexer())
+                     lines = list(split_token_stream(tokens, content))
+                     assert lines == [
+                         [('', u' '),
+                          ('nt', u'table'),
+                          ('p', u'.'),
+                          ('nc', u'dataTable')],
+                     ]
              class TestRollupTokens(object):

General Comments 0

Write
Preview

You need to be logged in to leave comments. Login now

No TODOs yet

	Site-wide shortcuts
/	Use quick search box
g h	Goto home page
g g	Goto my private gists page
g G	Goto my public gists page
g 0-9	Goto bookmarked items from 0-9
n r	New repository page
n g	New gist page

	Repositories
g s	Goto summary page
g c	Goto changelog page
g f	Goto files page
g F	Goto files page with file search activated
g p	Goto pull requests page
g o	Goto repository settings
g O	Goto repository access permissions settings
t s	Toggle sidebar on some pages