rhodecode-enterprise-ce Commit - r3444:e5ce0962

diffs: fixed case of bogus files diff rendering...

ergo -

r3444:e5ce0962 default

parent child

rhodecode/lib/codeblocks.py

0 +22 -12

                 lexer = lexer or get_lexer_for_filenode(filenode)
                 log.debug('Generating file node pygment tokens for %s, %s, org_lexer:%s',
                           lexer, filenode, org_lexer)
-                tokens = tokenize_string(filenode.content, lexer)
+                content = filenode.content
-                lines = split_token_stream(tokens)
+                tokens = tokenize_string(content, lexer)
+                lines = split_token_stream(tokens, content)
                 rv = list(lines)
                 return rv
                     yield pygment_token_class(token_type), token_text
-            def split_token_stream(tokens):
+            def split_token_stream(tokens, content):
                 """
                 Take a list of (TokenType, text) tuples and split them by a string
                  (TEXT, 'more'), (TEXT, 'text')]
                 """
-                buffer = []
+                token_buffer = []
                 for token_class, token_text in tokens:
                     parts = token_text.split('\n')
                     for part in parts[:-1]:
-                        buffer.append((token_class, part))
+                        token_buffer.append((token_class, part))
-                        yield buffer
+                        yield token_buffer
-                        buffer = []
+                        token_buffer = []
+                    token_buffer.append((token_class, parts[-1]))
-                    buffer.append((token_class, parts[-1]))
+                if token_buffer:
+                    yield token_buffer
-                if buffer:
+                elif content:
-                    yield buffer
+                    # this is a special case, we have the content, but tokenization didn't produce
+                    # any results. THis can happen if know file extensions like .css have some bogus
+                    # unicode content without any newline characters
+                    yield [(pygment_token_class(Token.Text), content)]
             def filenode_as_annotated_lines_tokens(filenode):
                     if filenode not in self.highlighted_filenodes:
                         tokenized_lines = filenode_as_lines_tokens(filenode, lexer)
                         self.highlighted_filenodes[filenode] = tokenized_lines
-                    return self.highlighted_filenodes[filenode][line_number - 1]
+                    try:
+                        return self.highlighted_filenodes[filenode][line_number - 1]
+                    except Exception:
+                        return [('', u'rhodecode diff rendering error')]
                 def action_to_op(self, action):
                     return {

rhodecode/tests/lib/test_codeblocks.py

0 +33 -10

             class TestSplitTokenStream(object):
                 def test_split_token_stream(self):
-                    lines = list(split_token_stream(
+                    tokens = [('type1', 'some\ntext'), ('type2', 'more\n')]
-                        [('type1', 'some\ntext'), ('type2', 'more\n')]))
+                    content = [x + y for x, y in tokens]
+                    lines = list(split_token_stream(tokens, content))
                     assert lines == [
                         [('type1', u'some')],
                     ]
                 def test_split_token_stream_single(self):
-                    lines = list(split_token_stream(
+                    tokens = [('type1', '\n')]
-                        [('type1', '\n')]))
+                    content = [x + y for x, y in tokens]
+                    lines = list(split_token_stream(tokens, content))
                     assert lines == [
                         [('type1', '')],
                         [('type1', '')],
                     ]
                 def test_split_token_stream_single_repeat(self):
-                    lines = list(split_token_stream(
+                    tokens = [('type1', '\n\n\n')]
-                        [('type1', '\n\n\n')]))
+                    content = [x + y for x, y in tokens]
+                    lines = list(split_token_stream(tokens, content))
                     assert lines == [
                         [('type1', '')],
                         [('type1', '')],
                     ]
                 def test_split_token_stream_multiple_repeat(self):
-                    lines = list(split_token_stream(
+                    tokens = [('type1', '\n\n'), ('type2', '\n\n')]
-                        [('type1', '\n\n'), ('type2', '\n\n')]))
+                    content = [x + y for x, y in tokens]
+                    lines = list(split_token_stream(tokens, content))
                     assert lines == [
                         [('type1', '')],
                         [('type1', '')],
                         [('type2', '')],
                     ]
+                def test_no_tokens_by_content(self):
+                    tokens = []
+                    content = u'\ufeff'
+                    lines = list(split_token_stream(tokens, content))
+                    assert lines == [
+                        [('', content)],
+                    ]
+                def test_no_tokens_by_valid_content(self):
+                    from pygments.lexers.css import CssLexer
+                    content = u'\ufeff table.dataTable'
+                    tokens = tokenize_string(content, CssLexer())
+                    lines = list(split_token_stream(tokens, content))
+                    assert lines == [
+                        [('', u' '),
+                         ('nt', u'table'),
+                         ('p', u'.'),
+                         ('nc', u'dataTable')],
+                    ]
             class TestRollupTokens(object):

General Comments 0

Write
Preview

You need to be logged in to leave comments. Login now

No TODOs yet

	Site-wide shortcuts
/	Use quick search box
g h	Goto home page
g g	Goto my private gists page
g G	Goto my public gists page
g 0-9	Goto bookmarked items from 0-9
n r	New repository page
n g	New gist page

	Repositories
g s	Goto summary page
g c	Goto changelog page
g f	Goto files page
g F	Goto files page with file search activated
g p	Goto pull requests page
g o	Goto repository settings
g O	Goto repository access permissions settings
t s	Toggle sidebar on some pages