rhodecode-enterprise-ce Files · configs/gunicorn_config.py

artifacts: alter DB column to allow storing really big artifacts.

marcink - - Load All Authors

File last commit:

r3875:c115b183 default


                r4004:ab65a8ce

default

Download file

             gunicorn_config.py
        
                    259 lines
            
             | 7.2 KiB
            
                | text/x-python
            
             |
                PythonLexer
            
             / configs / gunicorn_config.py
          
                    History
                
                 |
                  Annotation
                 | Raw
                 |Copy content
                 |Copy permalink

      """

      gunicorn config extension and hooks. Sets additional configuration that is

      available post the .ini config.

      - workers = ${cpu_number}

      - threads = 1

      - proc_name = ${gunicorn_proc_name}

      - worker_class = sync

      - worker_connections = 10

      - max_requests = 1000

      - max_requests_jitter = 30

      - timeout = 21600

      """

      import math

      import gc

      import sys

      import time

      import threading

      import traceback

      import random

      from gunicorn.glogging import Logger

      def get_workers():

          import multiprocessing

          return multiprocessing.cpu_count() * 2 + 1

      # GLOBAL

      errorlog = '-'

      accesslog = '-'

      loglevel = 'info'

      # SECURITY

      # The maximum size of HTTP request line in bytes.

      # 0 for unlimited

      limit_request_line = 0

      # Limit the number of HTTP headers fields in a request.

      # By default this value is 100 and can't be larger than 32768.

      limit_request_fields = 32768

      # Limit the allowed size of an HTTP request header field.

      # Value is a positive number or 0.

      # Setting it to 0 will allow unlimited header field sizes.

      limit_request_field_size = 0

      # Timeout for graceful workers restart.

      # After receiving a restart signal, workers have this much time to finish

      # serving requests. Workers still alive after the timeout (starting from the

      # receipt of the restart signal) are force killed.

      graceful_timeout = 60 * 60

      # The number of seconds to wait for requests on a Keep-Alive connection.

      # Generally set in the 1-5 seconds range.

      keepalive = 2

      # SERVER MECHANICS

      # None == system temp dir

      # worker_tmp_dir is recommended to be set to some tmpfs

      worker_tmp_dir = None

      tmp_upload_dir = None

      # Custom log format

      access_log_format = (

          '%(t)s %(p)s INFO  [GNCRN] %(h)-15s rqt:%(L)s %(s)s %(b)-6s "%(m)s:%(U)s %(q)s" usr:%(u)s "%(f)s" "%(a)s"')

      # self adjust workers based on CPU count

      # workers = get_workers()

      # n * 1024 * 0124 == n MBs, 0 = memory monitoring is disabled

      MAX_MEMORY_USAGE = 0 * 1024 * 1024

      # How often in seconds to check for memory usage

      MEMORY_USAGE_CHECK_INTERVAL = 30

      # If a gc brings us back below this threshold, we can avoid termination.

      MEMORY_USAGE_RECOVERY_THRESHOLD = MAX_MEMORY_USAGE * 0.8

      def _get_process_rss(pid=None):

          try:

              import psutil

              if pid:

                  proc = psutil.Process(pid)

              else:

                  proc = psutil.Process()

              return proc.memory_info().rss

          except Exception:

              return None

      def _time_with_offset():

          return time.time() - random.randint(0, MEMORY_USAGE_CHECK_INTERVAL/2.0)

      def pre_fork(server, worker):

          pass

      def post_fork(server, worker):

          server.log.info("<%s> WORKER spawned", worker.pid)

          # register memory last check time, with some random offset so we don't recycle all

          # at once

          worker._last_memory_check_time = _time_with_offset()

      def pre_exec(server):

          server.log.info("Forked child, re-executing.")

      def on_starting(server):

          server_lbl = '{} {}'.format(server.proc_name, server.address)

          server.log.info("Server %s is starting.", server_lbl)

      def when_ready(server):

          server.log.info("Server %s is ready. Spawning workers", server)

      def on_reload(server):

          pass

      def _format_data_size(size, unit="B", precision=1, binary=True):

          """Format a number using SI units (kilo, mega, etc.).

          ``size``: The number as a float or int.

          ``unit``: The unit name in plural form. Examples: "bytes", "B".

          ``precision``: How many digits to the right of the decimal point. Default

          is 1.  0 suppresses the decimal point.

          ``binary``: If false, use base-10 decimal prefixes (kilo = K = 1000).

          If true, use base-2 binary prefixes (kibi = Ki = 1024).

          ``full_name``: If false (default), use the prefix abbreviation ("k" or

          "Ki").  If true, use the full prefix ("kilo" or "kibi"). If false,

          use abbreviation ("k" or "Ki").

          """

          if not binary:

              base = 1000

              multiples = ('', 'k', 'M', 'G', 'T', 'P', 'E', 'Z', 'Y')

          else:

              base = 1024

              multiples = ('', 'Ki', 'Mi', 'Gi', 'Ti', 'Pi', 'Ei', 'Zi', 'Yi')

          sign = ""

          if size > 0:

              m = int(math.log(size, base))

          elif size < 0:

              sign = "-"

              size = -size

              m = int(math.log(size, base))

          else:

              m = 0

          if m > 8:

              m = 8

          if m == 0:

              precision = '%.0f'

          else:

              precision = '%%.%df' % precision

          size = precision % (size / math.pow(base, m))

          return '%s%s %s%s' % (sign, size.strip(), multiples[m], unit)

      def _check_memory_usage(worker):

          if not MAX_MEMORY_USAGE:

              return

          elapsed = time.time() - worker._last_memory_check_time

          if elapsed > MEMORY_USAGE_CHECK_INTERVAL:

              mem_usage = _get_process_rss()

              if mem_usage and mem_usage > MAX_MEMORY_USAGE:

                  worker.log.info(

                      "memory usage %s > %s, forcing gc",

                      _format_data_size(mem_usage), _format_data_size(MAX_MEMORY_USAGE))

                  # Try to clean it up by forcing a full collection.

                  gc.collect()

                  mem_usage = _get_process_rss()

                  if mem_usage > MEMORY_USAGE_RECOVERY_THRESHOLD:

                      # Didn't clean up enough, we'll have to terminate.

                      worker.log.warning(

                          "memory usage %s > %s after gc, quitting",

                          _format_data_size(mem_usage), _format_data_size(MAX_MEMORY_USAGE))

                      # This will cause worker to auto-restart itself

                      worker.alive = False

              worker._last_memory_check_time = time.time()

      def worker_int(worker):

          worker.log.info("[<%-10s>] worker received INT or QUIT signal", worker.pid)

          # get traceback info, on worker crash

          id2name = dict([(th.ident, th.name) for th in threading.enumerate()])

          code = []

          for thread_id, stack in sys._current_frames().items():

              code.append(

                  "\n# Thread: %s(%d)" % (id2name.get(thread_id, ""), thread_id))

              for fname, lineno, name, line in traceback.extract_stack(stack):

                  code.append('File: "%s", line %d, in %s' % (fname, lineno, name))

                  if line:

                      code.append("  %s" % (line.strip()))

          worker.log.debug("\n".join(code))

      def worker_abort(worker):

          worker.log.info("[<%-10s>] worker received SIGABRT signal", worker.pid)

      def worker_exit(server, worker):

          worker.log.info("[<%-10s>] worker exit", worker.pid)

      def child_exit(server, worker):

          worker.log.info("[<%-10s>] worker child exit", worker.pid)

      def pre_request(worker, req):

          worker.start_time = time.time()

          worker.log.debug(

              "GNCRN PRE  WORKER [cnt:%s]: %s %s", worker.nr, req.method, req.path)

      def post_request(worker, req, environ, resp):

          total_time = time.time() - worker.start_time

          worker.log.debug(

              "GNCRN POST WORKER [cnt:%s]: %s %s resp: %s, Load Time: %.4fs",

              worker.nr, req.method, req.path, resp.status_code, total_time)

          _check_memory_usage(worker)

      class RhodeCodeLogger(Logger):

          """

          Custom Logger that allows some customization that gunicorn doesn't allow

          """

          datefmt = r"%Y-%m-%d %H:%M:%S"

          def __init__(self, cfg):

              Logger.__init__(self, cfg)

          def now(self):

              """ return date in RhodeCode Log format """

              now = time.time()

              msecs = int((now - long(now)) * 1000)

              return time.strftime(self.datefmt, time.localtime(now)) + '.{0:03d}'.format(msecs)

      logger_class = RhodeCodeLogger

	Site-wide shortcuts
/	Use quick search box
g h	Goto home page
g g	Goto my private gists page
g G	Goto my public gists page
g 0-9	Goto bookmarked items from 0-9
n r	New repository page
n g	New gist page

	Repositories
g s	Goto summary page
g c	Goto changelog page
g f	Goto files page
g F	Goto files page with file search activated
g p	Goto pull requests page
g o	Goto repository settings
g O	Goto repository access permissions settings
t s	Toggle sidebar on some pages

				"""
				gunicorn config extension and hooks. Sets additional configuration that is
				available post the .ini config.

				- workers = ${cpu_number}
				- threads = 1
				- proc_name = ${gunicorn_proc_name}
				- worker_class = sync
				- worker_connections = 10
				- max_requests = 1000
				- max_requests_jitter = 30
				- timeout = 21600

				"""

				import math
				import gc
				import sys
				import time
				import threading
				import traceback
				import random
				from gunicorn.glogging import Logger


				def get_workers():
				import multiprocessing
				return multiprocessing.cpu_count() * 2 + 1

				# GLOBAL
				errorlog = '-'
				accesslog = '-'
				loglevel = 'info'

				# SECURITY

				# The maximum size of HTTP request line in bytes.
				# 0 for unlimited
				limit_request_line = 0

				# Limit the number of HTTP headers fields in a request.
				# By default this value is 100 and can't be larger than 32768.
				limit_request_fields = 32768

				# Limit the allowed size of an HTTP request header field.
				# Value is a positive number or 0.
				# Setting it to 0 will allow unlimited header field sizes.
				limit_request_field_size = 0

				# Timeout for graceful workers restart.
				# After receiving a restart signal, workers have this much time to finish
				# serving requests. Workers still alive after the timeout (starting from the
				# receipt of the restart signal) are force killed.
				graceful_timeout = 60 * 60

				# The number of seconds to wait for requests on a Keep-Alive connection.
				# Generally set in the 1-5 seconds range.
				keepalive = 2

				# SERVER MECHANICS
				# None == system temp dir
				# worker_tmp_dir is recommended to be set to some tmpfs
				worker_tmp_dir = None
				tmp_upload_dir = None

				# Custom log format
				access_log_format = (
				'%(t)s %(p)s INFO [GNCRN] %(h)-15s rqt:%(L)s %(s)s %(b)-6s "%(m)s:%(U)s %(q)s" usr:%(u)s "%(f)s" "%(a)s"')

				# self adjust workers based on CPU count
				# workers = get_workers()

				# n * 1024 * 0124 == n MBs, 0 = memory monitoring is disabled
				MAX_MEMORY_USAGE = 0 * 1024 * 1024

				# How often in seconds to check for memory usage
				MEMORY_USAGE_CHECK_INTERVAL = 30

				# If a gc brings us back below this threshold, we can avoid termination.
				MEMORY_USAGE_RECOVERY_THRESHOLD = MAX_MEMORY_USAGE * 0.8


				def _get_process_rss(pid=None):
				try:
				import psutil
				if pid:
				proc = psutil.Process(pid)
				else:
				proc = psutil.Process()
				return proc.memory_info().rss
				except Exception:
				return None


				def _time_with_offset():
				return time.time() - random.randint(0, MEMORY_USAGE_CHECK_INTERVAL/2.0)


				def pre_fork(server, worker):
				pass


				def post_fork(server, worker):
				server.log.info("<%s> WORKER spawned", worker.pid)
				# register memory last check time, with some random offset so we don't recycle all
				# at once
				worker._last_memory_check_time = _time_with_offset()


				def pre_exec(server):
				server.log.info("Forked child, re-executing.")


				def on_starting(server):
				server_lbl = '{} {}'.format(server.proc_name, server.address)
				server.log.info("Server %s is starting.", server_lbl)


				def when_ready(server):
				server.log.info("Server %s is ready. Spawning workers", server)


				def on_reload(server):
				pass


				def _format_data_size(size, unit="B", precision=1, binary=True):
				"""Format a number using SI units (kilo, mega, etc.).

				``size``: The number as a float or int.

				``unit``: The unit name in plural form. Examples: "bytes", "B".

				``precision``: How many digits to the right of the decimal point. Default
				is 1. 0 suppresses the decimal point.

				``binary``: If false, use base-10 decimal prefixes (kilo = K = 1000).
				If true, use base-2 binary prefixes (kibi = Ki = 1024).

				``full_name``: If false (default), use the prefix abbreviation ("k" or
				"Ki"). If true, use the full prefix ("kilo" or "kibi"). If false,
				use abbreviation ("k" or "Ki").

				"""

				if not binary:
				base = 1000
				multiples = ('', 'k', 'M', 'G', 'T', 'P', 'E', 'Z', 'Y')
				else:
				base = 1024
				multiples = ('', 'Ki', 'Mi', 'Gi', 'Ti', 'Pi', 'Ei', 'Zi', 'Yi')

				sign = ""
				if size > 0:
				m = int(math.log(size, base))
				elif size < 0:
				sign = "-"
				size = -size
				m = int(math.log(size, base))
				else:
				m = 0
				if m > 8:
				m = 8

				if m == 0:
				precision = '%.0f'
				else:
				precision = '%%.%df' % precision

				size = precision % (size / math.pow(base, m))

				return '%s%s %s%s' % (sign, size.strip(), multiples[m], unit)


				def _check_memory_usage(worker):

				if not MAX_MEMORY_USAGE:
				return

				elapsed = time.time() - worker._last_memory_check_time
				if elapsed > MEMORY_USAGE_CHECK_INTERVAL:
				mem_usage = _get_process_rss()
				if mem_usage and mem_usage > MAX_MEMORY_USAGE:
				worker.log.info(
				"memory usage %s > %s, forcing gc",
				_format_data_size(mem_usage), _format_data_size(MAX_MEMORY_USAGE))
				# Try to clean it up by forcing a full collection.
				gc.collect()
				mem_usage = _get_process_rss()
				if mem_usage > MEMORY_USAGE_RECOVERY_THRESHOLD:
				# Didn't clean up enough, we'll have to terminate.
				worker.log.warning(
				"memory usage %s > %s after gc, quitting",
				_format_data_size(mem_usage), _format_data_size(MAX_MEMORY_USAGE))
				# This will cause worker to auto-restart itself
				worker.alive = False
				worker._last_memory_check_time = time.time()


				def worker_int(worker):
				worker.log.info("[<%-10s>] worker received INT or QUIT signal", worker.pid)

				# get traceback info, on worker crash
				id2name = dict([(th.ident, th.name) for th in threading.enumerate()])
				code = []
				for thread_id, stack in sys._current_frames().items():
				code.append(
				"\n# Thread: %s(%d)" % (id2name.get(thread_id, ""), thread_id))
				for fname, lineno, name, line in traceback.extract_stack(stack):
				code.append('File: "%s", line %d, in %s' % (fname, lineno, name))
				if line:
				code.append(" %s" % (line.strip()))
				worker.log.debug("\n".join(code))


				def worker_abort(worker):
				worker.log.info("[<%-10s>] worker received SIGABRT signal", worker.pid)


				def worker_exit(server, worker):
				worker.log.info("[<%-10s>] worker exit", worker.pid)


				def child_exit(server, worker):
				worker.log.info("[<%-10s>] worker child exit", worker.pid)


				def pre_request(worker, req):
				worker.start_time = time.time()
				worker.log.debug(
				"GNCRN PRE WORKER [cnt:%s]: %s %s", worker.nr, req.method, req.path)


				def post_request(worker, req, environ, resp):
				total_time = time.time() - worker.start_time
				worker.log.debug(
				"GNCRN POST WORKER [cnt:%s]: %s %s resp: %s, Load Time: %.4fs",
				worker.nr, req.method, req.path, resp.status_code, total_time)
				_check_memory_usage(worker)


				class RhodeCodeLogger(Logger):
				"""
				Custom Logger that allows some customization that gunicorn doesn't allow
				"""

				datefmt = r"%Y-%m-%d %H:%M:%S"

				def __init__(self, cfg):
				Logger.__init__(self, cfg)

				def now(self):
				""" return date in RhodeCode Log format """
				now = time.time()
				msecs = int((now - long(now)) * 1000)
				return time.strftime(self.datefmt, time.localtime(now)) + '.{0:03d}'.format(msecs)


				logger_class = RhodeCodeLogger